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Bescheinigung 



Die Anmelderin Deutsches Krebsforschungszentrum Stiftung des offentlichen Rechts 
in Heidelberg, Neckar/Deutschland hat eine Patentanmeldung unter der Bezeich- 
nung 



"Modular aufgebaute RNA-Molekule mit zwei Sequenz- 
bereichstypen" 

am 26. Juni 1998 beim Deutschen Patent- und Markenamt eingereicht. 

Die angehefteten Stiicke sind eine richtige und genaue Wiedergabe der ursprung- 
lichen Unterlagen dieser Patentanmeldung. 

Die Anmeldung hat im Deutschen Patent- und Markenamt vorlaufig die Symbole 
C 12 N, C 07 H und C 07 K der International Patentklassifikation erhalten. 
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Modular aufgebaute RNA-Molekiile mit zwei Sequenzbereichstypen 
Die vorliegende Erfindung betrifft RNA 

typen gekennzeichnet sind, einen ersten Sequenzbereichstyp, der zur Aufrech- 
terhaltung der dreidimensionalen Struktur des RNA-Molekiils beitragt, und einen 
zweiten Sequenzbereichstyp, der fur die spezifische Bindung eines Liganden 
verantwortlich ist. Vorzugsweise sind diese RNA-Molekiile zur direkten Kontrolle 
fcer Genexpression von Nutzen. Die vorliegende Erfindung stellt ferner die erfin- 
dungsgemaSen RNA-Molekiile enthaltende Vektoren bereit. Ferner betrifft die 
vorliegende Erfindung Arzneimittel und diagnostische Zusammensetzungen, die die 
vorstehenden RNA-Molekule bzw. Vektoren enthalten, einen diese RNA-Molekule 
spezifisch erkennenden Antikorper bzw. spezif.sch an diese RNA-Molekule binden- 
de Antisense-RNA oder diese RNA-Molekule spaltende Ribozyme. Aufcerdem 
betrifft die Erfindung nicht-menschliche transgene Sauger und daraus erhaltene 
Zellen. 

Die Regulation der Genexpression bei Eukaryonten erfolgt in der Regel iiber Protei- 
ne, die iiblicherweise an bestimmte regulatorische Sequenzen stromaufwarts des 
iu exprimierenden Gens spezifisch binden und eine charakteristische Wirkung 
zeigen(RNA-Polymerasen,Transkriptionsfaktoren,Hormon-aktivierbareReze P toren 

etc.). Bisher sind nur wenige Beispiele fur die Kontrolle der Genexpression direkt 
iiber RNA-Molekiile bekannt. Dazu zahlen die fur die Inaktivierung des gesamten 
X-Chromosoms verantwortliche RNA "XIST" ("X-Chromosome inactivation spec.f.c 
transcript"), eine mit IPW bezeichnete RNA ("imprinted in Prader-Willi syndrome") 
und die RNA H19, die einen Tumorsuppressor darstellt und an der Steuerung 
bestimmter Entwicklungsvorgange beteiligt ist. Die artifizielle Kontrolle der Gen- 
expression wird inzwischen durch die Verwendung von spezifisch an mRNAs 
bindende Antisense-RNAs bewirkt bzw. durch die Verwendung katalytisch aktiver 
RNA-Molekiile, sogenannter Ribozyme, die an die Ziel-RNA nicht nur spezifisch 
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binden, sondern diese auch spalten und somit inaktivieren. Allerdings sind die 
Einsatzmoglichkeiten fpr diese Antisense-RNAs bzw. Ribozyme begrenzt,.vor allem 
hinsichtlich des zu bindenden und inaktivierenden Liganden, bei dem es sich 
grundsatzlich nur um RNA handeln kann. 

Somit besteht ein Bedarf nach der Bereitstellung von Verbindungen, die universell 
unterschiedlichste Zielmolekule, beispielsweise DNA, RNA, Proteine oder nieder- 
molekulare Substanzen, erkennen bzw. inaktivieren konnen und beispielsweise fur 
die Kontrolle der Genexpression und damit naturlich auch die Prevention und 
Behandlung von Krankheiten, die mit einer Storung der Genexpression einherge- 
^j^^^^en, 

Somit liegt der Erfindung im wesentlichen das technische Problem zugrunde, 
solche Verbindungen bereitzustellen, die unter anderem fur die Prevention oder 
Therapie (und auch Diagnose) von solchen Erkrankungen von Nutzen sind. 

Die Losung dieses technischen Problems wurde durch die Bereitstellung der in den 
Patentanspruchen gekennzeichneten Ausfuhrungsformen erreicht. 

Von den Erfindern konnte ein RNA-Molekul identifiziert werden, das die vorstehend 
beschriebenen, erwunschten Eigenschaften aufweist. Dieses RNA-Molekul wird 
O^^^iurch das Gen "NINTROX" (No INTRO ns X-chromosome) kodiert, das keine Introns 
^^^)esitzt, auf dem X-Chromosom lokalisiert ist und fur kein Protein kodiert. Die 
genomische Sequenz des menschlichen NINTROX-Gens einschliefclich des ver- 
mutlichen Promotors ist in Figur 1 gezeigt und die genomische Sequenz des 
murinen NINTROX-Gens einschlieRlich des vermutlichen Promotors in Figur 2. In 
Figur 3 wurde ein Sequenzvergleich zwischen humaner und muriner Sequenz 
durchgefuhrt. Daraus sieht man, daS es einige sehr sequenzkonservierte Bereiche 
gibt, die sich gemafc einer per Computer durchgef uhrten Energieanalyse durch eine 
hohe Energie auszeichnen (vgl. Fig. 4). 

Wahrend der Wirkungsmechanismus der vorstehend diskutierten, auf RNA-Ebene 
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wirksamen Gene vollkommen unklar war, konnte durch die Analyse des NINTROX- 
Gens zum ersten Mai das Wirkprinzip eines solchen Gens, das nachstehend genau- 
er beschrieben wird, ermittelt werden. Das NINTROX-Gen tragt wesentlich zur 
Aufrechterhaltung der Funktionen des ZNS insbesondere des Hippocampus bei. 
Defekte in diesem Gen fuhren zu Einschrankungen der ZNS-Funktionen, die bis zu 
mentaTen Retardierungen reichenrDesweiteren Qbt das NINTROX-Geneine wichti- 
ge Funktion bei der Kontrolle der Zellproliferation aus. Dabei konnen Veranderun- 
gen in diesem Gen zu Fehlern in der Kontrolle des Zellwachstums, beispielsweise 
zu Krebs, fuhren. Die weiteren Untersuchungen ergaben, daS das Expressions- 
muster des NINTROX-Gens gewebe- und entwicklungsspezifisch erfolgt. Die Nort- 
ern-Analysen zeigten eine Expression in alien untersuchten fotalen und adulten 
eweben. Es konnten keine Sequenzhomologien mit bereits bekannten Sequenzen 
festgestellt werden. 




Die Strategic die zur Identifizierung dieses Nucleinsauremolekuls fuhrte, wird 
nachstehend beschrieben. Im Rahmen der systematischen Analyse der q28-Region 
des menschlichen X-Chromosoms konnten verschiedene exprimierte Sequenzen 
nachgewiesen und isoliert werden. Mit Hilfe dieser exprimierten Sequenzen konn- 
ten einige bisher noch nicht bekannte Gene gemafc Standardmethoden identifiziert 
und charakterisiert werden, u.a. das der vorliegenden Anmeldung zugrunde liegen- 
de NINTROX-Gen. Nachdem das komplette Transkript dieses Gens isoliert war, 
konnten weder langere offene Leseraster innerhalb des Transkripts noch Introns im 
Gen nachgewiesen werden. Mit Hilfe der menschlichen Klone konnte das murine 
Homolog dieses Gens gemaB Standardmethoden isoliert werden. Auch dieses Gen 
zeigte keinen offenen Leserahmen oder Introns. 

Interessanterweise zeigen die erfindungsgemafcen NINTROX-RNA-Molekiile einen 
modularen Aufbau, d.h., sie sind durch das Vorhandensein von zwei verschiedenen 
Sequenzbereichstypen gekennzeichnet. Wahrend der eine Sequenzbereich die 
Aufrechterhaltung der dreidimensionalen Struktur erlaubt und, wie sich durch 
Vergleich der Sequenzen aus verschiedenen Spezies (Mensch, Hamster, Kanguruh, 
Makaken, Orang-Utan, Schimpansen und Ratte; vgl. Fig. 5) ergibt, nur bedingt 
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konserviert ist, ist der zweite Sequenzbereich, cler fur die spezifische Bindung an 
das Zielmolekul verantwortlich ist, sequenzkonserviert. Aufgrund dieser modularen 
Bauweise der NINTROX-RNA ist es moglich, diese so zu modifizieren, daf£ ihre 
Wirkung nicht nur auf die vorstehend beschriebene Kontrolle der Genexpression 
beschrankt ist, sondern fur eine Vielzahl von Moglichkeiten eingesetzt werden 
kann. Neben der Kontrolle der Genexpression kann mit Hilfe solcher modular 
aufgebauter RNA-Molekule auch die Struktur (z.B. Chromatinstruktur, Nuclear- 
Scaffold) von chromosomalen Bereichen verandert werden. Hierdurch ergibt sich 
die bisher nicht gekannte Moglichkeit, die Expression von groReren genomischen 
Bereichen gezielt beeinflussen zu konnen. So konnen bestimmte Sequenzbereiche 
A^^^Uer beiden Module des NINTROX-Gens durch andere Sequenzen oder sogar artifi- 
^^^Kielle Sequenzen ersetzt werden, wodurch (a) die Wechselwirkung dieser RNA mit 
anderen Bindungspartnern (RNA, DNA, andere Makromolekule und niedermolekula- 
re Verbindungen) oder deren biochemische Umsetzung (z.B. Erhohung oder Er- 
niedrigung der Umsatzrate) gezielt verandert werden, wodurch das RNA-Molekul 
gezielt neuen Aufgaben angepafct werden kann, und/oder (b) die dreidimensionale 
Struktur der NINTROX-RNA gezielt spezifischen Anforderungen angepaBt werden 
kann. Dadurch kann eine teilweise oder vollig neuartige Funktion des erfindungs- 
gemaSen NINTROX-RNA-Molekuls erzielt werden. 

Somit betrifft eine Ausfuhrungsform der vorliegenden Erfindung ein RNA-Molekul, 
d^^^^las an einen Liganden binden kann und folgende Sequenzbereiche umfafct: (a) 
^^^Feinen die dreidimensionale Struktur des RNA-Molekuls aufrechterhaltenden Se- 
quenzbereich, und (b) einen Sequenzbereich fur die spezifische Bindung des 
Liganden. 

Der hier verwendete Ausdruck "einen die dreidimensionale Struktur des RNA- 
Molekuls aufrechterhaltenden Sequenzbereich" besitzt folgenden Begriffinhalt. 
Dreidimensionale RNA-Strukturen werden durch Basenpaarung verschiedener 
Basen innerhalb des RNA-Molekuls ermoglicht. Hierbei werden Strukturen wie 
"Stems" oder "Loops" gebildet. Viele dieser Strukturen ergeben so die Gesamt- 
struktur des RNA-Molekuls. Eine Sequenzanderung innerhalb des RNA-Molekuls 
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kann ohne Folgen fur die raumliche Struktur bleiben, wenn die Sequenzverande- 
rung die Basenpaarungen nicht verandert oder wenn die Sequenzanderung durch 
eine zweite Sequenzanderung ausgeglichen wird. Wird beispielsweise die Basen- 
paarung A-T zerstort, indem das A zum G mutiert, so kann diese Mutation durch 
die weitere Mutation des T zum C ausgeglichen werden. Dadurch andert sich zwar 
die Sequenz, aber die raumTiche Struktur bleibt gFeich. Dies hat zur Folge, dalS die 
diesselbe RNA-Struktur durch extrem viele unterschiedliche RNA-Sequenzen 
gebildet werden kann. Hinweise auf bestimmte RNA-Strukturen ergibt die Analyse 
der darin enthaltenen Energie. Diese Analyse kann mittels kommerziell erhaltlicher 
Computerprogramme (z.B. "FOLD"; Michael Zuker und P. Stiegler: Optimal Compu- 
tt^^H" Folding of Large RNA Sequences using Thermodynamics and Auxiliary Informa- 
^^^Ron, Nucleic Acids Research (81), 9(1), S. 133) durchgefuhrt werden. Je geringer 
der Energieinhalt einer bestimmten Sequenz ist, desto stabiler sind die dreidimen- 
sionalen RNA-Strukturen. Die Analyse des NINTROX-Gens zeigte eine konservierte 
Verteilung dieser energiearmen Strukturen (vgl. Fig. 5). Die Basensequenz dieser 
RNA-Bereiche sind bei verschiedenen Spezies sehr unterschiedlich, der Energie- 
inhalt ist aber aufcerst konserviert. In Fig. 3 sind dies die Sequenzbereiche, die 
nicht durch einen schwarzen Balken am Rand gekennzeichnet sind. Dies bedeutet, 
daR der die dreidimensionale Struktur des RNA-Molekuls aufrechterhaltenden 
Sequenzbereich nicht sequenz-, aber energiekonserviert ist. So richten sich Modifi- 
kationen dieses Sequenzbereichs auch nicht nach der Basensequenz, sondern nach 
fe^^^der Erhaltung des ermittelten Energieinhalts. 

Der hier verwendete Ausdruck "ein Sequenzbereich fur die spezifische Bindung des 
Liganden" betrifft einen Sequenzbereich, der so beschaffen ist, daS er den ge- 
wiinschten Liganden spezifisch binden kann. Diese Sequenzbereiche sind sehr 
sequenzkonserviert. In Fig. 3 sind diese Bereiche durch einen schwarzen Balken 
am Rand gekennzeichnet und haben einen hohen Energieinhalt (vgl. Fig. 5). Dies 
deckt sich mit der Beobachtung, daB diese Sequenzbereiche nicht "verpackt" sind, 
sondern nach auBen gerichtet sind und fur die Bindung des Liganden, enzymati- 
sche Reaktionen oder die Bindung an andere RNA- oder DNA-Sequenzen ver- 
antwortlich sind. Falls es sich bei dem zu bindenden Liganden urn ein RNA-Molekul 



25. Junl 1998 




- 6 - 

oder ein DNA-Molekul handeit, wird dieser Sequenzbereich zu einem entsprechen- 
den, ausreichend langen Abschnitt des RNA-Molekuls oder DNA-Molekiils Kom- 
plementaritat aufweisen. Falls es sich bei dem zu bindenden Liganden um ein 
Protein handeit, kann der Sequenzbereich (b) ganz oder teilweise durch eine DNA- 
Sequenz ausgetauscht oder erganzt werden, von der bekannt ist, date sie das 
gewunschte Protein spezifisch bindet. 

Die beiden oben beschriebenen Sequenztypen kommen mehrere Male innerhalb der 
NINTROX-RNA vor. Der Austausch oder die Veranderung einzelner solcher Module 
ermoglicht die gezielte Veranderung der NINTROX-RNA. So ist bei einer Modifika- 
tt^^^ion des die dreidimensionale Struktur aufrechterhaltenden Moduls auf den er- 
^^^Pnittelten Energieinhalt zu achten, sodaS dieser einen minimalen Wert beibehalt. 
Die Modifikation des anderen Sequenzbereichs, obwohl dieser gerade als sequenz- 
konserviert gilt, unterliegt nur geringen Beschrankungen. So kann dieser Bereich 
ganz oder teilweise weggelassen werden oder kann Insertionen enthalten. Bei- 
spielsweise konnen auch Sequenzen in das NINTROX-RNA-Molekul integriert 
werden, die bekannte biochemische Eigenschaften aufweisen oder bestimmte 
DNA-, RNA-Molekule oder Proteine binden. Daruber hinaus konnen Zufallssequen- 
zen unterschiedlicher Lange an verschiedenen Stellen des NINTROX-Gens einge- 
baut werden und danach kann auf spezifische Eigenschaften wie biochemische 
Umsetzung, spezifische Bindung usw. selektioniert werden. 

^^^^n einer bevorzugten Ausfuhrungsform des erfindungsgemaSen RNA-Molekuls 
umfaRt der Sequenzbereich (a) die in Figur 3 nicht am Rand gekennzeichneten 
Sequenzbereiche oder dazu verwandte Sequenzen, die ebenfalls die Aufrechterhal- 
tung der dreidimensionalen Struktur des RNA-Molekuls erlauben und von dem 
Sequenzbereich (a) in Figur 3 abweicht. Diese Abweichungen betreffen die Ad- 
dition, Deletion und/oder Insertion von Basen, wobei der fur die Sequenz von Figur 
(3) ermittelte Energieinhalt zu mindestens 80 %, vorzugsweise mindestens 85 % 
und mehr bevorzugt zu mindestens 90 % erhalten bleibt. Vorzugsweise bleibt bei 
diesen eingefuhrten Anderungen die ursprungliche dreidimensionale Struktur 
erhalten. 
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In einer besonders bevorzugten Ausfuhrungsform umfafSt der Sequenzbereich (b) 
des erfindungsgemafcen RNA-Molekuls die in Figur 3 dargesteilten Sequenzen, die 
am Rand mit schwarzen Balken versehen sind. 

Tn einer weiteren 'bevorzugten 

Molekuls handelt es sich bei dem zu bindenden Liganden um ein DNA-Molekul oder 
ein Protein oder Enzym, z.B. DNA-Polymerase I. Vorzugsweise enthalt das erfin- 
dungsgemaSe RNA-Molekul eine Poly(A)-Sequenz am 3'-Ende, was zur Stabilitat 
_ in einer gewunschten Wirtszelle beitragen kann. 

^^^^^n einer weiteren bevorzugten Ausfuhrungsform wird das erfindungsgemalSe RNA- 
Molekul zur Kontrolle der Genexpression verwendet. Dazu wird der Sequenzbereich 
(b) so modifiziert, daB er ein fur die Genexpression verantwortliches Protein bindet, 
oder an einen bestimmten DNA-Bereich des Zielgens, wodurch beispielsweise die 
Anlagerung von Proteinen, die einen die Genexpression hemmenden oder fordern- 
den EinfluS haben, behindert oder unterbunden wird, oder auch direkt an die 
mRNA des Zielgens, wodurch beispielsweise die Translation behindert oder unter- 
bunden wird. Der Fachmann kann ohne weiteres durch entsprechende Modifikatio- 
nen des Sequenzbereichs (b) und evtl. auch des Sequenzbereichs (a) das erfin- 
dungsgemafce RNA-Molekul so modifizieren, daS es den gewunschten Liganden 
indet und so die Genexpression in dem gewunschten MaB kontrolliert. 

Die vorliegende Erfindung betrifft auch eine, das erfindungsgemaSe RNA-Molekul 
kodierende DNA-Sequenz, sowie ein Gen mit folgenden Merkmalen: Es enthalt 
einen Promotor, der die Transkription in einer gewunschten Wirtszelle erlaubt 
sowie eine damit funktionell verknupfte, das erfindungsgemaBe RNA-Molekul 
kodierende DNA-Sequenz. Vorzugsweise enthalt das Gen zusatzlich ein Termina- 
tionssignal und eine Polyadenylierungsstelle. 

In einer bevorzugten Ausfuhrungsform umfafct das erfindungsgemaSe Gen die in 
Figur 1 oder 2 dargestellte Sequenz. 
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Die das erfindungsgemafce RNA-Molekul kodierenden DNA-Sequenzen oder Gene 
kdnnen auch in einen Vektor inseriert werden. Somit umfaRt die vorliegende 
Erfindung auch diese DNA-Sequenzen oder Gene enthaltende Vektoren. Die 
Bezeichnung "Vektor" bezieht sich auf ein Plasmid (z.B. pUC18, pBR322, pBlueS- 
cript), auf ein Virus oder ein anderes geeignetes Vehikel. In einer bevorzugten 
Ausfuhrungsform ist die das erfindungsgemafSe DNA-Molekul kodierende Sequenz 
im Vektor mit regulatorischen Elementen funktionell verknupft, die dessen Ex- 
pression in prokaryotischen oder eukaryotischen Wirtszellen erlauben. Solche 
Vektoren enthalten neben den regulatorischen Elementen, beispielsweise einem 
^fe^^^feromotor, typischerweise einen Replikationsursprung und spezifische Gene, die die 
^^^Pphanotypische Selektion einer transformierten Wirtszelle erlauben. Zu den regulato- 
rischen Elementen fur die Expression in Prokaryonten, beispielsweise E.coli, zahlen 
der lac-,trp-Promotor oder T7-Promotor, und fur die Expression in Eukaryonten der 
AOX1- Oder GAL1-Promotor in Hefe, und der CMV-,SV40-, RVS-40-Promotor, 
CMV- oder SV40-Enhancer fur die Expression in tierischen Zellen. Weitere Bei- 
spiele fur geeignete Promotoren sind der Metallothionein I- und der Polyhedrin- 
Promotor. Zu geeigneten Vektoren zahlen beispielsweise auf T7 basierende Ex- 
pressionsvektoren fur die Expression in Bakterien (Rosenberg et al.. Gene 56(198- 
7), 1 25), pMSXND fur die Expression in Saugerzellen (Lee und Nathans, J.Biol.Ch- 
em. 263(1 988), 3521 ) und von Baculovirus abgeleitete Vektoren fur die Expression 

In einer bevorzugten Ausfuhrungsform ist der die erfindungsgemafcen RNA-Moleku- 
le kodierenden Sequenzen enthaltende Vektor ein viraler Vektor, beispielsweise ein 
Vaccinia-Virus oder Adenovirus, der bei einer Gentherapie von Nutzen ist. Beson- 
ders bevorzugt sind RNA-Viren, vor allem Retroviren. Beispiele fur geeignete 
Retroviren sind MoMuLV, HaMuSV, MuMTV, RSV oder GaLV. Fur Zwecke der 
Gentherapie kdnnen die erfindungsgemaSen RNA-Molekule auch in Form von 
kolloidalen Dispersionen zu den Zielzellen transportiert werden. Dazu zahlen 
beispielsweise Liposomen oder Lipoplexe (Mannino et al., Biotechniques 6 (1988), 
682). 
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Allgemeine, auf dem Fachgebiet bekannte Verfahren konnen zur Konstruktion von 
Expressionsvektoren, die die erfindungsgema&en RNA-Mdlekule., kodierenden 
Sequenzen und geeignete Kontrollsequenzen enthalten, verwendet werden. Zu 
diesen Verfahren zahlen beispielsweise in vitro-Rekombinationstechniken, syn- 
thetische Verfahren, sowie in vivo-Rekombihatidnsverfahren, wie sie beispiels- 
weise in Sambrook et al., beschrieben sind. 

Die vorliegende Erfindung betrifft auch die vorstehend beschriebenen Vektoren 
enthaltende Wirtszellen. Zu diesen Wirtszellen zahlen Bakterien, Hefe, Insekten- 
4|^^^ind Tierzellen, vorzugsweise Saugerzellen. Bevorzugte Saugerzellen sind CHO-, 
^^^P/ERO-, BHK-, HeLa-, COS-, MDCK, 293- und WI38-Zellen. Verfahren zur Trans- 
formation dieser Wirtszellen, zur phanotypischen Selektion von Transformanten 
und zur Expression der erfindungsgemafcen Nucleinsauremolekule unter Verwen- 
dung der vorstehend beschriebenen Vektoren sind auf dem Fachgebiet bekannt. 



Die vorliegende Erfindung betrifft auch Antikorper, die das erfindungsgemafce RNA- 
Molekul spezifisch erkennen. Die Antikorper konnen monoclonale, polyclonale oder 
synthetische Antikorper sein oder Fragmente davon, beispielsweise Fab-, Fv-oder 
scFv-Fragmente. Vorzugsweise handelt es sich dabei um einen monoclonalen 
Antikorper. Die erfindungsgemafcen Antikorper konnen gemalS Standardverfahren 
fiergestellt werden, wobei das erfindungsgemafce RNA-Molekiil oder ein Fragment 
'davon als Immunogen dienen. Monoclonale Antikorper konnen beispielsweise 
durch das von Kdhler und Milstein (Nature 256 (1975), 495) und Galfre (Meth. 
Enzymol.73 (1981), 3) beschriebene Verfahren hergestellt werden, wobei Maus- 
Myelomzellen mit von immunisierten Saugern stammenden Milzzellen fusioniert 
werden. Diese Antikorper konnen beispielsweise zur Hemmung der Aktivitat der 
erfindungsgema&en RNA-Molekule, beispielsweise zur Beeinflussung der Gen- 
expression, verwendet werden. Die Antikorper konnen beispielsweise auch in 
diagnostischen Assays verwendet werden, um nachweisen zu konnen, ob eine 
Dysregulation der Genepression, beispielsweise durch einen Verlust oder Mangel 
der verantwortlichen NINTROX-RNA einhergeht. Die Antikorper konnen in Immu- 
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nassays in Fliissigphase vorliegen oder an einen festen Trager gebunden werden. 
Dabei konnen die Artfikorper auf verschiedene Art und Weise markiert sein. Ge- 
eignete Marker und Markierungsverfahren sind auf dem Fachgebiet bekannt. 
Beispiele fur Immunassays sind ELISA und RIA. 

Die Erfindung betrifft ferner Antisense-RNAs, die an ein erfindungsgemafces RNA- 
Molekul spezifisch binden und zur Herabsetzung der Expression von Genen, die 
unter direkter Kontrolle von RNA, beispielsweise NINTROX-RNA, stehen, in vitro 
oder in vivo verwendet werden konnen. Die Verabreichung der erfindungsgemafSen 
Antisense-RNA an eine Zielzelle fuhrt zu einer herabgesetzten Genexpression und 
(fe^^^^t fur die Behandlung von Erkrankungen besonders nutzlich, die durch eine zu 
^^^ffiohe Genexpression des unter direkter RNA-Kontrolle stehenden Gens gekenn- 
zeichnet sind (z.B. bei Krebserkrankungen). Dabei konnen die Antisense-RNAs 
direkt verabreicht werden oder als diese kodierende DNA, vorzugsweise in einen 
geeigneten Vektor inseriert. Zu den geeigneten Vektoren zahlen alle bereits vor- 
stehend in Zusarnmenhang mit den erfindungsgemaften RNA-Molekulen beschrie- 
benen Vektoren. 

Die erfindungsgemaSen Antisense-RNAs umfassen eine Antisense-Sequenz mit 
mindestens 7 bis 1 0 oder mehr Nucleotides die mit einer Sequenz des erfindungs- 
gemafcen RNA-Molekuls, beispielsweise NINTROX-RNA, spezifisch hybridisieren. 
A^^^^Vorzugsweise weist die erfindungsgemaSe Antisense-RNA eine Lange von etwa 
^^^^10 bis etwa 50 Nucleotiden oder von etwa 14 bis etwa 35 Nucleotiden auf. In 
weiteren Ausfuhrungsformen handelt es sich bei den erfindungsgemaBen Antisen- 
se-RNAs urn RNAs, die kiirzer als etwa 100 Nucleotide oder kurzer als etwa 200 
Nucleotide sind. Im allgemeinen sollten die Antisense-RNAs lang genug sein, urn 
eine stabile Doppelhelix zu bilden, jedoch kurz genug (in Abhangigkeit von der Art 
der Zufuhrung) urn, falls erwunscht, in vivo verabreicht werden zu konnen. Im 
allgemeinen ist die Antisense-Sequenz zur Gewahrleistung einer spezifischen 
Hybridisierung zu der Ziel-Sequenz im wesentlichen komplementar. In bestimmten 
Ausfuhrungsformen ist die Antisense-Sequenz genau komplementar zu der Zielse- 
quenz. Die Antisense-RNAs konnen jedoch auch Nucleotid-Substitutionen, Ad- 
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ditionen, Deletionen, Transitionen, Transpositionen oder Modifikationen enthalten, 
solange die spezifische Bindung an die relevante Zielsequenz als eine funktionelle 
Eigenschaft der Antisense-RNA beibehalten wird. Die Antisense-RNAs konnen 
auch zusatzlich zu den Antisense-Sequenzen weitere Sequenzen enthalten. Die 
Antisense-RNAs (sowie die erfindungsgema&en RNA-Molekule) konnen unter 
Verwendung jedes zur Herstellung von Nucleinsauren geeigneten Verfahrens 
hergestellt werden, beispielsweise durch chemische Synthese de novo oder durch 
Clonierung. Eine Antisense-RNA kann beispielsweise auch dadurch hergestellt 
werden, dafc eine Sequenz der Ziel-RNA oder eines Fragments davon in umgekehr- 
ter Orientierung funktionell mit einem Promotor verknupft in einen Vektor (z.B. ein 
lasmid) inseriert wird. Unter der Voraussetzung, dafc der Promotor und vorzugs- 
eise Terminations- und Polyadenylierungssignale korrekt positioniert sind, wird 
der Strang der inserierten Sequenz, der dem nicht-codierenden Strang entspricht, 
transkribiert, und dieser wirkt als eine Antisense-RNA. 



cr 



Die vorliegende Erfindung betrifft auch Ribozyme, die die erfindungsgemafcen RNA- 
Molekule spezifisch spalten und somit auch zur Hemmung der Genexpression von 
Nutzen sind. Nutzliche Ribozyme konnen 5'- und 3'-terminale Sequenzen um- 
fassen, die zu der Ziel-RNA komplementar sind, und diese konnen vom Fachmann 
nach Standardverfahren konstruiert werden (siehe beispielsweise PCT-Veroffentli- 
chung WO 93/23572). Zu den erfindungsgemafcen Ribozymen gehoren beispiels- 
eise Ribozyme mit den Merkmalen der Gruppe l-lntron-Ribozyme (Cech, Biotech- 
fiology 13 (1995), 323) und "hammerhead"-Ribozyme (Edgington, Biotechnology 
10 (1992), 256). 



In einer Ausfuhrungsform werden die erfindungsgemafcen Ribozyme per se als 
Arzneimittel verwendet. In einer anderen Ausfuhrungsform werden Gentherapiever- 
fahren zur Expression von Ribozymen in einer Zielzelle ex vivo oder in vivo ange- 
wandt. Die Verfahren zur Verabreichung der Ribozyme bzw. zur Expression der 
Ribozyme in vivo entsprechen den vorstehend in Zusammenhang mit den erfin- 
dungsgemafcen RNA-Molekiilen beschriebenen Verfahren. 
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Die Isolierung und Charakterisierung des menschlichen NfNTROX-Gens und ins- 
besondere des Maushomologs des NINTROX-Gens erlaubt die Etablierung eines 
Tiermodells, das die Bereitstellung von Therapien und Arzneimitteln fur die vor- 
stehend diskutierten Krankheiten erlaubt. Durch die Bereitstellung der Sequenz des 
NINTROX-Gens ist sowohl eine Diagnose (post- oder pranatal) als auch eine 
Therapie von Erkrankungen moglich, bei denen die Genexpression durch das Fehlen 
von NINTROX-RNA oder einen UberschuGvon NINTROX-RNA gekennzeichnet ist. 
Die therapeutische oder diagnostische Anwendung ist jedoch nicht nur auf Krank- 
heiten beschrankt, die mit einer Fehlregulation der Expression eines Gens ein- 
_ hergehen, das unter Kontrolle der NINTROX-RNA steht, sondern die entsprechend 
fH^^^wen vorstehend beschriebenen Moglichkeiten veranderten RNA-Molekule bieten 
^^^Kiaruber hinaus die Moglichkeit vollig neuer Therapeutika. 

Die vorliegende Erfindung betrifft somit ferner Arzneimittel, die die vorstehend 
beschriebenen RNA-Molekule, Vektoren, Antikorper, Antisense-RNAs oder Ribozy- 
me enthalten. Diese Arzneimittel enthalten gegebenenfalls zusatzlich einen pharma- 
zeutisch vertraglichen Trager. Geeignete Trager und die Formulierung derartiger 
Arzneimittel sind dem Fachmann bekannt. Zu geeigneten Tragern zahlen beispiels- 
weise Phosphat-gepufferte Kochsalzlosungen, Wasser, Emulsionen, beispielsweise 
Ol/Wasser-Emulsionen, Netzmittel, sterile Losungen etc. Die Verabreichung der 
Arzneimittel kann oral oder parenteral erfolgen. Zu den Verfahren fur die parentera- 
■^He Verabreichung gehoren die topische, intra-arterielle (z.B. direkt zu einem Tumor), 
^^^Fintramuskulare, subkutane, intramedullare, intrathekale, intraventrikulare, intrave- 
nose, intraperitoneale oder intranasale Verabreichung. Die geeignete Dosierung 
wird von dem behandelnden Arzt bestimmt und hangt von verschiedenen Faktoren 
ab, beispielsweise von dem Alter, dem Geschlecht, dem Gewicht des Patienten, 
dem Stadium eines Tumors, der Art der Verabreichung etc.. 

Vorzugsweise wird das erfindungsgemaSe Arzneimittel zur Prevention oder Be- 
handlung von Erkrankungen verwendet, die mit einer Storung der Kontrolle der 
Genexpression in Zusammenhang stehen. Besonders bevorzugt wird das erfin- 
dungsgemaSe Arzneimittel zur Behandlung von Tumorerkrankungen oder Erkran- 
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kungen des ZNS verwendet. Dabei kann das Arzneimittel in der Gentherapie 
Verwendung finden, wobei die vorstehend beschriebenen Verfahren bzw. Vektoren 
zur Einschleusung der erfindungsgemafcen Nucleinsauren Anwendung finden 
konnen. Andererseits kann das erfindungsgemalSe RNA-Molekul direkt verabreicht 
werden, um so in Zellen, die keine funktionalen Kopien des RNA-Molekiils mehr 
" ~ besitzen/nofi^ 

Die vorliegende Erfindung betrifft ferner eine diagnostische Zusammensetzung, die 
das erfindungsgemaSe RNA-Molekul, die dieses kodierende DNA-Sequenz oder ein 
Fragment davon, den erfindungsgemaSen Antikorper oder ein Fragment davon, 

H|^^^^)der die erfindungsgema&e Antisense-RNA oder ein Fragment davon enthalt oder 
^^^^Combinationen davon, gegebenenfalls zusammen mit einem geeigneten Nachweis- 
mittel. Mittels dieser diagnostischen Zusammensetzung kann der Nachweis dar- 
uber erfolgen, ob die direkt die Genexpression steuernde RNA, beispielsweise 
NINTROX-RNA vorhanden ist oder im Vergleich zu einer Kontrolle in zu hoher oder 
niedriger Konzentration oder mit einer abweichenden Lange vorliegt. Dabei wird 
vorzugsweise der Antikorper oder ein Fragment davon in den vorstehend beschrie- 
benen Assays oder die Antisense-RNA oder ein Fragment davon als Sonde in 
Hybridisierungsexperimenten verwendet. Vorzugsweise weist dazu die Sonde eine 
Lange von mindestens 10, besonders bevorzugt mindestens 15 Basen auf. Ge- 
eignete, auf Hybridisierung basierende Nachweisverfahren sind dem Fachmann 

^^^^kbekannt. Geeignete Markierungen fur die Sonde sind dem Fachmann ebenfalls 
^^^^bekannt und dazu zahlen beispielsweise Markierung mit Radioisotopes Biolumi- 
neszenz-, Chemilumineszenz-, Fluoreszenzmarkern, Metallchelaten, Enzymen etc. 
Bei diesem Verfahren konnen dem Fachmann bekannte Methoden beziiglich der 
Preparation von Gesamt-RNA bzw. poly(A) + RNA aus biologischen Proben, der 
Auftrennung der RNAs auf nach GroBe auftrennenden Gelen, beispielsweise 
denaturierenden Agarosegelen, der Herstellung und Markierung der Sonde und des 
Nachweises der Hybride, beispielsweise uber "Northern-Blot"; angewandt werden. 
Vorzugsweise erfolgt dabei die Diagnose von Erkrankungen, wie sie vorstehend im 
Zusammenhang mit den erfindungsgemaRen Arzneimitteln beschrieben wurden. 



25. Juni 1998 




- 14 - 

Eine Diagnose kann auch auf DNA-Ebene erfolgen. Dabei wird mit den vorstehend 
beschriebenen Nucleinsauremolekulen die Intaktheit des Gens, das die an der 
Regulation der Genexpression direkt beteiligte RNA, beispielsweise NINTROX-RNA, 
kodiert untersucht (beispielsweise hinsichtlich Vorhandensein, Lange oder Mutatio- 
nen). Bei diesem Verfahren konnen dem Fachmann bekannte Methoden bezuglich 
der Preparation von DNA aus biologischen Proben, des Restriktionsverdaus der 
DNA, der Auftrennung der Restriktionsfragmente auf nach GroSe auftrennenden 
Gelen, beispielsweise Agarosegelen, der Herstellung und Markierung der Sonde 
und des Nachweises der Hybridisierung, beispielsweise uber "Southern-Blot"; 
angewandt werden. Der vorstehende Nachweis kann auch uber PCR durchgefuhrt 
|tt^^^ky/erden. Dabei werden Primer verwendet, die die kodierende Sequenz flankieren. 
^^^R)iagnostisch von Bedeutung sind dabei Amplifikationsprodukte von DNA aus dem 
fraglichen Gewebe, die sich, beispielsweise hinsichtlich ihrer Lange oder Sequenz, 
von den Amplifikationsprodukten von DNA aus gesundem Gewebe unterscheiden. 

Gegenstand der vorliegenden Erfindung ist ferner ein nicht-menschliches Saugetier, 
dessen NINTROX-Gen verandert ist, z.B. durch Insertion einer heterologen Se- 
quenz, insbesondere einer Selektionsmarkersequenz. 

Der Ausdruck "nicht-menschliches Saugetier" umfaSt jegliches Saugetier, dessen 
GR in seiner induzierenden Funktion verandert sein kann. Beispiele solcher Sauge- 
ttj^^^iere sind Maus, Ratte, Kaninchen, Pferd, Rind, Schaf, Ziege, Affe, Schwein, Hund 
^^^^und Katze, wobei Maus bevorzugt ist. 

Der Ausdruck "NINTROX-Gen, das verandert ist" bedeutet, daS in dem im nicht- 
menschlichen Saugetier naturlich vorkommenden NINTROX-Gen durch Standard- 
methoden eine Deletion von ca. 1-2 kb durchgefuhrt und an dessen Stelle eine 
heterologe Sequenz, z.B. ein Konstrukt zur Vermittlung von Antibiotika-Resistenz 
(z.B. eine "neo-Kassette") eingefugt wird. Diese Methode ist allgemein in Schwar- 
tzberg et al., Proc. Natl. Acad. Sci. USA, Vol. 87, S. 3210-3214, 1990 beschrie- 
ben, worauf hier Bezug genommen wird. 
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Ein weiterer Gegenstand der vorliegenden Erfindung sind Zellen, die aus dem 
vorstehenden nicht-menschlichen Saugetier erhalten werden. Diese Zellen konnen 
in jeglicher Form vorliegen, z.B. in einer Primar- oder Langzeit-Kultur. 

Ein erfindungsgema&es nicht-menschliches Saugetier kann durch ubliche Verf ahren 
bereitgestellt werden. GQnstig ist ein Verfahren, das folgende Schritte umfaGt: 

(a) Herstellung eines DNA-Fragments, insbesondere eines Vektors, enthaltend 
ein verandertes NINTROX-Gen, wobei das NINTROX-Gen durch Insertion 
einer heterologen Sequenz, insbesondere eines selektierbaren Markers, ver- 
andert worden ist; 



(b) Preparation embryonaler Stammzellen aus einem nicht-menschlichen Sauger 
(bevorzugt Maus); 

(c) Transformation der embryonalen Stammzellen von Schritt (b) mit dem DNA- 
Fragment von Schritt (a), wobei das NINTROX-Gen in den embryonalen 
Stammzellen durch homologe Rekombination mit dem DNA-Fragment von 
(a) verandert wird, 

(d) Kultivieren der Zellen von Schritt (c), 

^^^^e) Selektion der kultivierten Zellen von Schritt (d) auf das Vorhandensein der 
heterologen Sequenz, insbesondere des selektierbaren Markers, 

(f) Erzeugen chimerer nicht-menschlicher Sauger aus den Zellen von Schritt (e) 
durch Injektion dieser Zellen in Sauger-Blastocysten (bevorzugt Maus-Blasto- 
zyien), ObertragenderBlastozysten in pseudo-schwangere weibliche Sauger 
(bevorzugt Maus) und Analyse der erhaltenen Nachkommen auf eine Ver- 
anderung des NINTROX-Gens. 

In Schritt (c) wird der Mechanismus der homologen Rekombination (vgl. R.M. 
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Torres, R. Kuhn, Laboratory Protocols for Conditional Gene Targeting, Oxford 
University Press, 1997) ausgenutzt, urn embryonale Stammzellen zu transfizieren. 
Die homologe Rekombination zwischen den in einem Chromosom vorhandenen 
DNA-Sequenzen und neuen, hinzugefugten clonierten DNA-Sequenzen ermoglicht 
das Einfugen eines klonierten Gens in das Genom einer lebenden Zelle anstelle des 
ursprunglichen Gens. Mit dieser Methode konnen bei Verwendung embryonaler 
Keimzellen via Chimaren Tiere erhalten werden, die fur das gewunschte Gen oder 
den gewunschten Genteil oder die gewunschte Mutation homozygot sind. 

Der Ausdruck "embryonale Stammzellen" betrifft jegliche embryonalen Stammzel- 
n eines nicht-menschlichen Saugetiers, die sich zur Mutierung des NINTROX- 
ens eignen. Vorzugsweise sind die embryonalen Stammzellen von der Maus, 
insbesondere die Zellen E14/1 oder 129/SV. 

Der Ausdruck "Vektor" umfafct jeglichen Vektor, der durch Rekombination mit der 
DNA von embryonalen Stammzellen eine Veranderung des NINTROX-Gens er- 
moglicht. Vorzugsweise weist der Vektor einen Marker auf, mit dem auf vorhan- 
dene Stammzellen selektioniert werden kann, in denen die gewunschte Rekom- 
bination erfolgt ist. Ein solcher Marker ist z.B. die loxP/tkneo-Cassette, die mit 
Hilfe des Cre/loxP-Systems wieder aus dem Genom entfernt werden kann. 

kDesweiteren kennt der Fachmann Bedingungen und Materialien, urn die Schritte 
'(a)-(f) durchzufuhren. 

Mit der vorliegenden Erfindung wird ein nicht-menschliches Saugetier bereitge- 
stellt, dessen NINTROX-Gen verandert ist. Diese Veranderung kann ein Ausschal- 
ten der Genexpression-regulierenden Funktion sein. Mit einem solchen Saugetier 
bzw. Zellen daraus kann selektiv die Genexpression-kontrollierde Funktion von 
NINTROX untersucht werden. Ferner ist es hiermit moglich, Substanzen, Arznei- 
mittel und Therapieansatze zu finden, mit denen selektiv auf die kontrollierde 
Funktion von NINTROX eingewirkt werden kann. Daher liefert die vorliegende 
Erfindung eine Basis, urn auf die verschiedensten Erkrankungen einzuwirken. 
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Solche Erkrankungen sind z.B. Einschrankungen der ZNS-Funktionen, die bis zu 
mentalen Retardierungen reichen oder die Induktion von Krebs durch Fehler bei der 
Kontolle der Zellproliferation. Ferner sollte es moglich sein, die Rolle des Hippocam- 
pus naher zu untersuchen und zu charakterisieren. 

Die folgenden Klone "wurden am" 4. Mai" 1 998 bei f deFDSMZ, "Deutsche ISamml'uhg" 
von Mikroorganismen und Zellkulturen GmbH, Mascheroder Weg 1b, D-38124 
Braunschweig, hinterlegt: 

E.coli JFC-484, Teilsequenz der humanen NINTROX- 
cDNA 

E.coli JFC-622, Teilsequenz der murinen NINTROX-cDNA 
E.coli JFC-8D3, Sequenz der humanen genomischen 
NINTROX-DNA 

E.coli JFC-P1-165, Sequenz der murinen genomischen 
NINTROX-DNA 

Die Figuren zeigen: 

Humane Sequenz des NINTROX-Gens (einschliefclich des 
vermutlichen Promotors) 

Murine Sequenz des NINTROX-Gens (einschliefclich des ver- 
mutlichen Promotors) 

Sequenzvergleich humane (oben) und murine (unten) Seq- 
uenz 

gestrichelt: Promotor 

durchgezogener Balken: Sequenzkonservierte Bereiche (b) 




DSM 12153: 

DSM 12154: 
DSM 12155: 



DSM 12156: 



Figur 1 : 




Figur 2: 



Figur 3: 



Figur 4: 



Energiediagramm der Sequenzen aus Fig. 3 
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Figur 5: Homologievergleich von NINTROX aus verschiedenen Spe- 
zies 

Das folgende Beispiel erlautert die Erfindung: 

Beispiel 1: Identifizierung und Charakterisierung des NINTROX-Gens 

Zur Identifikation von transkribierten Sequenzen aus der Region 
Xq27.3 bis Xqter wurde zunachst aus verschiedenen Geweben des 
Schweins (Niere, Herz, MHz, Leber, Gehirn usw.) Gesamt-RNA 
isoliert und mit Hilfe von Oligo-dT in Erststrang-cDNA uberschrie- 
ben. Diese komplexen cDNA-Proben, die alle in dem jeweiligen 
Gewebe transkribierten Gene reprasentieren, wurden dann radio- 
aktiv markiert und mit der Xq27.3-Xqter spezifischen Cosmid-Bi- 
bliothek hybridisiert. Die Cosmid-Bibliothek wurde dabei in Form 
von systematisch auf Nylonmembranen angeordneten Cosmid- 
Klonen analysiert. Anschliefcend wurde von den Cosmid-Klonen, die 
mit den komplexen cDNA-Proben positive Hybridisierungssignale 
aufwiesen, die Cosmid-DNA isoliert, mit EcoRI verdaut, durch Gel- 
elektrophorese getrennt und auf Nylonmembranen transferiert. Die 
Restriktionsfragmente, die dann eine positive Hybridisierung mit 
den komplexen, radioaktiv markierten cDNA-Proben aufwiesen, 
wurden dann isoliert und radioaktiv markiert und zum Durchsuchen 
einer fotalen humanen cDNA-Bank verwendet. Hierdurch konnten 
positive cDNA-Klone isoliert werden, die das Transkript des NIN- 
TROX-Gens reprasentierten. 
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Patentanspriiche 

1 . RNA-Molekul, das an einen Liganden binden kann und folgende Sequenz- 
bereiche umfaSt: 

(a) einen die dreidimensionale Struktur des RNA-Molekiils aufrechter- 
haltenden Sequenzbereich; und 

(b) einen Sequenzbereich fur die spezifische Bindung des Liganden. 

2. RNA-Molekul nach Anspruch 1, wobei der Sequenzbereich (a) die in Figur 
3 ohne Balken am Rand dargestellte Sequenz umfafct oder eine dazu ver- 
wandte Sequenz, die ebenfalls die Aufrechterhaltung der dreidimensiona- 
len Struktur des RNA-Molekuls erlaubt. 

3. RNA-Molekul nach Anspruch 1 oder 2, wobei der Sequenzbereich (b) die 
in Figur 3 mit Balken am Rand dargestellte Sequenz umfafSt. 

4. RNA-Molekul nach einem der Anspruche 1 bis 3, wobei der Ligand ein 
DNA-Molekul oder ein Protein ist. 

5. RNA-Molekul nach einem der Anspruche 1 bis 4, das zusatzlich eine Po- 
ly(A)-Sequenz am 3'-Ende enthalt. 

6. RNA-Molekul nach einem der Anspruche 1 bis 5 zur Kontrolle der Genex- 
pression. 

7. DNA-Sequenz, die ein RNA-Molekul nach einem der Anspruche 1 bis 6 
kodiert. 

8. Gen, das die in Figur 1 oder 2 dargestellte Sequenz umfaSt. 



9. 



Vektor, der die DNA-Sequenz nach Anspruch 7 oder das Gen nach An- 
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spruch 8 enthaltend. 

10. Vektor nach Anspruch 9, wobei der Vektor ein Plasmid ist. 

1 1 . Vektor nach Anspruch 10, wobei der Vektor ein viraler Vektor ist. 

12. Vektor nach Anspruch 1 1, der ein RNA-Virus ist. 

13. Vektor nach Anspruch 12, der ein Retrovirus ist. 

14. Wirtszelle, den Vektor nach einem der Anspruche 9 bis 1 3 enthaltend. 

15. Wirtszelle nach Anspruch 14, wobei die Wirtszelle eine Saugerzelle ist. 

16. Antikorper oder ein Fragment davon, die ein RNA-Molektil nach einem der 
Anspuche 1 bis 6 spezifisch binden. 

17. Antikorper nach Anspruch 16, wobei der Antikorper ein monoklonaler 
Antikorper ist. 

18. Antisense-RNA, die an ein RNA-Molektil nach einem der Anspruche 1 bis 
6 spezifisch bindet. 

19. Ribozym, das ein RNA-Molektil nach einem der Anspruche 1 bis 6 spezi- 
fisch spaltet. 

20. Verwendung des RNA-Molekuls nach einem der Anspruche 1 bis 6, des 
Vektors nach einem der Anspruche 9 bis 13, des Antikorpers oder des 
Fragments davon nach Anspruch 16 oder 17, der Antisense-RNA nach 
Anspruch 18 oder des Ribozyms nach Anspruch 19 zur Herstellung eines 
Arzneimittels zur Prevention oder Behandlung von Krankheiten, die mit 
einer Storung der Kontrolle der Genexpression in Zusammenhang stehen. 
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21 . Verwendung des RNA-Molekuls nach einem der Anspruche 1 bis 6, der 
DNA-Sequenz nach Anspruch 7 oder eines Fragments davon, des Antikor- 
pers oder des Fragments davon nach Anspruch 1 6 oder 1 7, oder der Anti- 
sense-RNA nach Anspruch 18 oder eines Fragments davon zur Diagnose 
von Krankheiten, die mit einer Storung der Kontrolle der Genexpression in 
Zusammenhang steheh. 

22. Verwendung nach Anspruch 20 oder 21 , wobei es sich bei der Krankheit 
urn eine Tumorerkrankung oder einer Erkrankung des Zentralnervensy- 
stems handelt. 

23. Nicht-menschliches Saugetier, dessen NINTROX-Gen durch Insertion einer 
heterologen Sequenz verandert ist. 

24. Nicht-menschliches Saugetier nach Anspruch 22, wobei die heterologe 
Sequenz eine Selektionsmarkersequenz ist. 

25. Nicht-menschliches Saugetier nach Anspruch 22 oder 23, wobei die Se- 
lektionsmarkersequenz Resistenz gegen Neomycin vermittelt. 

26. Verfahren zur Herstellung eines nicht-menschlichen Saugetiers nach ei- 
nem der Anspruche 22-25 gekennzeichnet durch die folgenden Schritte: 

(a) Herstellung eines DNA-Fragments, insbesondere eines Vektors, 
enthaltend ein verandertes NINTROX-Gen, wobei das NINTROX- 
Gen durch Insertion einer heterologen Sequenz, insbesondere eines 
selektierbaren Markers, verandert worden ist; 

(b) Preparation embryonaler Stammzellen aus einem nicht-mensch- 
lichen Sauger (bevorzugt Maus); 



(c) Transformation der embryonalen Stammzellen von Schritt (b) mit 
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dem DNA-Fragment von Schritt (a), wobei das NINTROX-Gen in 
den embryonalen Stammzellen durch homologe Rekombination mit 
dem DNA-Fragment von (a) verandert wird, 

(d) Kultivieren der Zellen von Schritt (c), 

(e) Selektion der kultivierten Zellen von Schritt (d) auf das Vorhanden- 
sein der heterologen Sequenz, insbesondere des selektierbaren 
Markers, 

(f) Erzeugen chimerer nicht-menschlicher Sauger aus den Zellen von 
Schritt (e) durch Injektion dieser Zellen in Sauger-Blastocysten 
(bevorzugt Maus-Blastozyten), Ubertragen der Blastozysten in pseu- 
do-schwangere weibliche Sauger (bevorzugt Maus) und Analyse 
der erhaltenen Nachkommen auf eine Veranderung des NINTROX- 
Gens. 
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Zusammenfassung 



Beschrieben werden modular aufgebaute RNA-Molekule'; die an einen Ligan- 
den binden konnen und durch zwei Sequenzbereiche gekennzeichnet sind, 
einen ersten Sequenzbereich, der zur Aufrechterhaltung der dreidimensiona- 
len Struktur des RNA-Molekuls beitragt, und einen zweiten Sequenzbereich, 
der fur die spezifische Bindung des Liganden verantwortlich ist. Diese RNA- 
Molekule, beispielsweise die NINTROX-RNA, konnen zur direkten Beein- 
flussung der Genexpression verwendet werden. Beschrieben werden ferner 
die erfindungsgema&en RNA-Molekule enthaltende Vektoren sowie Arznei- 
mittel und diagnostische Zusammensetzungen, die die vorstehenden RNA- 
Molekule bzw. Vektoren enthalten, ein diese RNA-Molekule spezifisch 
erkennender Antikorper bzw. spezifisch an diese RNA-Molekule bindende 
Antisense-RNA oder diese RNA-Molekule spaltende Ribozyme. AuSerdem 
betrifft die Erfindung nicht-menschliche Sauger, deren NINTROX-Gen durch 
Insertion einer heterologen Sequenz verandert ist und daraus erhaltene 
Zellen. 




Humane Sequenz des Nicht Jcodierender. RNA-Gens ( einschl ie31 ich des putati 
Promocors) ' 

1 CTTAGAGTTT CGTGGCTTCA GGGTGGGAGT AGTTGGAGCA TTGGGGATGT 

51 TrTTCTTACC GACAAGCACA GTCAGGTTGA AGACCTAACC AGGGCCAGAA 

101 GTAGCTTTGC ACTTTTCTAA ACTAGGCTCC TTCAACAAGG CTTGCTGCAG 

151 ATACTACTGA CCAGACAAGC TGTTGACCAG GCACCTCCCC TCCCGCCCAA 

2 01 ACCTTTCCCC CATGTGGTCG TTAGAGACAG AGCGACAGAG CAGTTGAGAG 
251 GACACTCCCG TTTTCGGTGC CATCAGTGCC CCGTCTACAG CTCCCCCAGC 

3 01 TCCCCCCACC TCCCCCACTC CCAACCACGT TGGGACAGGG AGGTGTGAGG 

3 51 CAGGAGAGAC AGTTGGATTC TTTAGAGAAG ATGGATATGA CCAGTGGCTA 

4 01 TGGCCTGTGC GATCCCACCC GTGGTGGCTC AAGTCTGGCC CCACACCAGC 
451 CCCAATCCAA AACTGGCAAG GACGCTTCAC AGGACAGGAA AGTGGCACCT 
501 GTCTGCTCCA GCTCTGGCA.T GGCTAGGAGG GGGGAGTCCC TTGAACTACT 
551 GGGTGTAGAC TGGCCTGAAC CACAGGAGAG GATGGCCCAG GGTGAGGTGG 
601 CATGGTCCAT TCTC.-_-.GGGA CGTCCTCCAA CGGGTGGCGC TAGAGGCCAT 
551 GGAGGCAGTA GGACAAGGTG CA.GGCAGGCT GGCCTGGGGT CAGGCCGGGC 
701 AGAGCACAGC GGGGTGAGAG GGATTCCTAA TC AC TC AG AG CAGTCTGTGA 
751 CTTAGTGGAC AGGGG.hGGGG GCAAAGGGGG AGG AG AA G AA AA.TG TTCTTC 
801 CAGTTACTTT CCAATTCTCC TTTAGGGACA GCTTAGAATT ATTTGCACTA 
3 51 TTGAGTCTTC ATGTTCCCAC TTCAAAACAA ACAGATGCTC TGAGAGCAAA 
9 01 CTGGCTTGAA TTGGTGACAT TTA.GTCCCTC AAGC C AC C AG ATGTGACAGT 
951 GTTGAGAACT ACCTGGATTT GTATATATAC CTGCGCTTGT TTTAAAGTGG 

10 01 GCTCAGCACA TAGGGTTCCC ACGAAGCTCC G AAAC TC T AA GTGTTTGCTG 

1051 CAATTTTA.TA AGGACTTCCT GATTGGTTTC TCTTCTCCCC TTCCATTTCT 

1101 GCCTTTTGTT CATTTCATCC TTTCACTTCT TTCCCTTCCT CCGTCCTCCT 

1151 CCTTCCTAGT TCATCCCTTC TCTTCCAGGC AGCCGCGGTG CCCAACCACA 

12 01 CTTGTCGGCT CCAGTCCCCA GAACTCTGCC TGCCCTTTGT CCTCCTGCTG 

12 51 CCAGTACCAG CCCCACCCTG TTTTGAGCCC TGAGGAGGCC TTGGGCTCTG 

13 01 C TG AG TC C AA CCTGGCCTGT CTGTGAAGAG CAAGAGAGCA GCAAGGTCTT 
13 51 GCTCTCCTAG GTAGCCCCCT CTTCCCTGGT AAGAAAAAGC AAAAGGCATT 
1401 TCCCACCCTG AACAACGAGC CTTTTCACCC TTCTACTCTA GAGAAGTGGA 
1451 CTGGAGGAGC TGGGCCCGAT TTGGT AG TTG AGGAAAGCAC AGAGGCCTCC 
15 01 TGTGGCCTGC CAGTCATCGA GTGGCCCAAC AGGGGCTCCA TGCCAGCCGA 
15 51 CCTTGACCTC ACTCAGAAGT C C AG AG TC T A GCGTAGTGCA GCAGGGCAGT 
1501 AGCGGTACCA ATGCAGAACT CCCAAGACCC GAGCTGGGAC CAGTACCTGG 
15 51 GTCCCCAGCC CTTCCTCTGC TCCCCCTTTT CCCTCGGAGT TCTTCTTGAA 
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17 01 TGGCAATGTT TTGCTTTTGC TCGATGCAGA CAGGGGGCCA GAACACCACA 

17 51 CATTTCACTG TCTGTCTGGT CCATAGCTGT GGTGTAGGGG CTTAGAGGCA 

1801 TGGGCTTGCT GTGGGTTTTT AATTGATCAG TTTTCATGTG GGATCCCATC 

1851 TTTTTAACCT CTGTTCAGGA AGTCCTTATC TAGCTGCATA TCTTCATCAT 

19 01 ATTGGTATAT CCTTTTCTGT G TTTAC AG AG ATGTCTCTTA TATCTAAATC 

19 51 TGTCCAACTG AGAAGTACCT TATCAAAGTA GC AAATG AG A CAGCAGTCTT 



-2 0 01 - -AJTGC-TTCCAG AAACACCCAC AGGCATGTCC- -GA-TGTGAGGT— GG-TGGGATGA- - 



2051 


AGTGTCAAGT 


GTGTGTTGTC 


TTGTGTATTT 


1 CAGTTATTGT 


CCCTGGCTTC 


2101 


CTTACTATGG 


TGTAATCA.TG 


AAGGAGTGAA 


. ACATCATAGA 


AAC TGTC TAG 


2151 


CACTTCCTTG 


CCAGTCTTTA 


GTGATCAGGA 


ACCATAGTTG 


ACAGTTCCAA 


2201 


TGAGTAGCTT 


AAGAAAAAAC 


CGTGTTTGTC 


TCTTCTGGAA 


TGGTTAGAAG 


2251 


TGAGGGAGTT 


TGCCCCGTTC 


TGTTTG TAG A 


GTCTCATAGT 


TGGACTTTCT 


2301 


AGCATATATG 


TGTCCATTTC 


CTTA.TGCTGT 


AAAAGCAAGT 


C C TGC AAC C A 


22 51 


AACTCCCATC 


AG.CCCAATCC 


CTGATCCCTG 


ATCCCTTCCA 


CCTGCTCTGC 


2401 


TGATGACCCC 


CCCAGCTTCA 


CTTCTGACTC 


TTCCCCAGGA 


AGGGAAGGGG 


2451 


GGTCAGAAGA 


GAGGGTGAGT 


CCTCCAGAAC 


TCTTCCTCCA. 


AGGACAGAAG 


2501 


GCTCCTGCCC 


CCATAGTGGC 


C TCG AAC TC C 


TGGCACTACC 


AAAGG AC AC T 


2551 


TATCCACGAG 


AGCGCAGCAT 


CCGACCAGGT 


TGTCACTGAG 


AAGATGTTTA 


2501 


TTTTGGTCAG 


TTGGGTTTTT 


ATGTATTATA 


CTTAGTCAAA 


TGTAATGTGG 


2651 


CTTCTGGAAT 


CATTGTCCAG 


AGGTGCTTCC 


CCGTCACCTG 


GGCGTCATCT 


2701 


GGTCCTGGTA 


AGAGGAGTGC 


GTGGCCCACC 


AGGCCCCCCT 


GTCACCCATG 


2751 


ACAGTTCATT 


CAGGGCCGAT 


GGGGGAGTCG 


TGGTTGGGAA 


CACAGCATTT 


2801 


CAAGCGTCAC 


TTTATTTCAT 


TCGGGCCCCA 


CCTGCAGCTC 


C C TC AAAG AG 


2851 


GCAGTTGCCC 


AGCCTCTTTC 


CGTTGCAGTT 


TATTCCAGAG 


CTGCCAGTGG 


2901 


GGCCTGAGGC 


TCCTTAGGGT 


TTTCTCTCTA 


TTTCCCCCTT 


TCTTCCTCAT 


2951 


TCCCTCGTCT 


TTCCCAAAGG 


CATCACGAGT 


CAGTCGCCTT 


TCAGCAGGCA 


3001 


GCCTTGGCGG 


T7TATCGCCG 


TGGCAGGGAG 


GGGCCCTGCA 


GCTCTCATGC 


3051 


TGGCCCTGGC 


TTGGGGTCAG 


GTTGACAGGA 


GGTTGGAGGG 


AAAGG C TT AA 


3101 


GCTGCAGGAT 


TCTCACCAGC 


TGTGTCGGGG 


CCAGTTTTGG 


GGTCTGACCT 


3151 


CAATTTCAAT 


TTTGTCTGTA 


CTTGAACATT 


ATGAAGATGG 


GGGCCTCTTT 


3201 


CAGTGAATTT 


GTGAACAGCA 


G AATTG AC G G 


ACAGCTTTCC 


AGTACCCATG 


3251 


GGG CTAGGTC 


ATTAAGGCCA 


CATCCACAGT 


CTCCCCCACC 


CTTGTTCCAG 


3301 


TTGTTAGTTA 


CTACCTCCTC 


TCCTGACAAT 


ACTGTATGTC 


GTCGAGCTCC 


3351 


CCCCAGGTCT 


ACCCCTCCCG 


GCCCTGCCTG 


CTGGTGGGCT 


TGTCATAGCC 


3401 


AGTGGGATTG 


CCGGTCTTGA 


CAGCTCAGTG 


AGCTGGAGAT 


ACTTGGTCAC 
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3 451 AGCCAGGCGC TAGCACAGCT CCCTTCTGTT GATGCTGTAT TCCCATATCA 

3 501 AAAGGCACAG GGG AC AC C C A GAAACGCCAC ATCCCCCAAT CCATCAGTGC 

3 551 CAAACTAGCC AACGGCCCCA GCTTCTCAGC TCGCTGGATG GCGGAAGCTG 

3 601 CTACTCGTGA GCGCC AG TGC. GGGTGC AG AC AATCTTCTGT TGGGTGGCAT 



3751 GCGAAAGAGG GTAATAACCA GACACAAACT GCCAAGTTGG GTGGAGAAAG 
3 801 GAGTTTCTTT AGCTGACAGA ATCTCTGAAT TTTAAATCAC TTAGTAAGCG 
3 351 GCTCAAGCCC AGGAGGGAGC AGAGGGATAC GAGCGGAGTC CCCTGCGCGG 

3 9 01 GACCATCTGG AATTGGTTTA GCCCAAGTGG AG C C TG AC AG CCAGAACTCT 
3951 GTGTCCCCCG TCTAACCACA GCTCCTTTTC CAGAGCATTC CAGTCAGGCT 
4001 CTCTGGGCTG ACTGGGCCAG GGGAGGTTAC AGGTACCAGT TCTTTAAGAA 
40 51 GATCTTTGGG CATATACATT TTTAGCCTGT GTCATTGCCC CAAATGGATT 
4101 CCTGTTTCAA GTTCACACCT GCAGATTCTA GGACCTGTGT CCTAGACTTC 
4151 AGGGAGTCAG CTGTTTCTAG AGTTCCTACC ATGGAGTGGG TCTGGAGGAC 

4 2 01 CTGCCCGC-TG GGGGGGCAGA GCCCTGCTCC CTCCGGGTCT TCCTACTCTT 
4 2 51 CTCTCTGCTC TGACGGGATT TGTTGATTCT CTCCATTTTG GTGTCTTTCT 
4 3 01 CTTTTAGATA TTGTATCAA.T C TTT AG AA-AA. GGCATAGTCT ACTTGTTATA 

43 51 AATCGTTAGG ATACTGCCTC CCCCAGGGTC TAAAATTACA T ATT AG AG GG 
4401 GAAAAGCTGA ACACTGAAGT CAGTTCTCAA CAATTTAGAA GG AA-AA.C C T A 

44 51 GAAAA.CATTT GGCA.GAAAA.T TACATTTCGA TGTTTTTGAA. TGAATA.CAAG 
4501 CAAGCTTTTA CAACAGTGCT GA.TCTAAAAA. TACTTAGCAC TTGGCCTGAG 

45 51 ATGCCTGGTG AG C ATT A C AG GCAAGGGGAA. TCTGGAGGTA GCCGACCTGA 
4601 GGACATGGCT TCTGAACCTG TCTTTTGGGA GTGGTATGGA AGGTGGAGCG 
4651 TTCACCAGTG ACCTGGAAGG CCCAGCACCA CCCTCCTTCC CACTCTTCTC 

4 701 ATCTTGACAG AGCCTGCCCC AGCGCTGACG TGTCAGGAAA ACACCCAGGG 

47 51 AA.C TAGG AAG GCACTTCTGC CTGAGGGGCA GCCTGCCTTG CCCACTCCTG 

48 01 CTCTGCTCGC CTCGGATCAG CTGAGCCTTC TGAGCTGGCC TCTCACTGCC 

48 51 TCCCCAAGGC CCCCTGCCTG CCCTGTCAGG AGGCAGAAGG AAGCAGGTGT 
4901 GAGGGCAGTG CAAGGAGGGA GCACAACCCC CAGCTCCCGC TCCGGGCTCC 

49 51 GACTTGTGCA CAGGCAGAGC CCAGACCCTG GAGGAAATCC TACCTTTGAA 

5 001 TTCAAGAACA TTTGGGGAAT TTGGAAATCT CTTTGCCCCC AAACCCCCAT 

50 51 TCTGTCCTAC C TTT AA.TC AG GTCCTGCTCA GCAGTGAGAG CAGATGAGGT 
5101 GAAAAGGCCA AGAGGTTTGG CTCCTGCCCA CTGATAGCCC CTCTCCCCGC 
5151 AGTGTTTGTG TGTCAAGTGG CAAAGCTGTT CTTCCTGGTG AC CC TG ATT A 
52 01 TATCCAGTAA CACATAGACT GTGCGCATAG GCCTGCTTTG TCTCCTCTAT 



3 651 CATTCCAGGC CCGAAGCATG AACAGTGCAC CTGGGACAGG GAGCAGCCCC 



3701 



AAATTGTCAC 



GCCCAGCTTT TCATTGCTGT GACAGTGATG 



(Smb.) 
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5 2 51 CCTGGGCTTT TGTTTTGCTT TTTAGTTTTG CTTTTAGTTT TTCTGTCCCT 
53 01 TTTATTTAAC GCACCGACTA GACACACAAA GCAGTTGAAT TTTTATATAT 

53 51 ATATCTGTAT ATTGCACAAT TATAAACTCA TTTTGCTTGT GGCTCCACAC 

54 01 ACACAAAAAA AGACCTGTTA AAATT AT AC C TGTTGCTTAA TTACAATATT 
54 51 TCTGATAACC ATAGCATAGG ACAAGGGAAA ATAAAAAAAG AAAAAAAAGA 
5 5 01 AAAAAAAACG ACAAATCTGT CTGCTGGTCA CTTCTTCTGT CCAAGCAGAT 

- -55-5-I- '■ TCGTGGTCTT" "TTCCTCGCTT"CTTTCAAGGG "CTTTCCTGTG "CCAGGTGAAG " 
5 601 GAGGCTCCAG GCAGCACCCA GGTTTTGCAC TCTTGTTTCT CCCGTGCTTG 
5 651 TGAAAGAGGT CCCAAGGTTC TGGGTGCAGG AGCGCTCCCT TGACCTGCTG 
5 7 01 AAGTCCGGAA CGTAGTCGGC ACAGCCTGGT CGCCTTCCAC CTCTGGGA.GC 
57 51 TGGAGTCCAC TGGGGTGGCC TGACTCCCCC AGTCCCCTTC CCGTGACCTG 
5 301 GTCAGGGTGA GCCCATGTGG AGTCAGCCTC GCAGGCCTCC C TG C C AG TAG 
5 851 GGTCCGAGTG TGTTTCATCC TTCCCACTCT GTCGAGCCTG GGGGGTGGAG 
5901 CGGAGACGGG AGGCZ^GGCC TGTCTCGGAA CCTGTGAGCT GCACCAGGTA 
5951 G?±ACGCCAGG G AC C C C AG AA TCATGTGCGT CAGTCCAAGG GGTCCCCTCC 
5001 AGGAGTAGTG AAGACTCCA.G AA-A TG T C C C T TTCTTCTCCC CCATCCTACG 
50 51 A.GTAATTGCA. TTTGCTTTTG TAA.TTCTTAA TGAGCAATA.T CTGCTAGAGA 
5101 GTTTAGCTGT AACAGTTCTT TTTGATCATC TTTTTTTAAT AA T T AG AAA C 
5151 ACCAAAAAAA TCCAGAAACT TGTTCTTCCA AAGCAGAGAG CATTATAATC 
62 01 ACCAGGGCCA AAAGCTTCCC TCCCTGCTGT CATTGCTTCT TCTGAGGCCT 

62 51 GAATCCAAAA GAAAAACAGC CATAGGCCCT TTCAGTGGCC GGGCTACCCG 

63 01 TGAGCCCTTC GGAGGACCAG GGCTGGGGCA GCCTCTGGGC CCACATCCGG 

63 51 GGCCAGCTCC GGCGTGTGTT CAGTGTTAGC AGTGGGTCAT GA.TGCTCTTT 

54 01 CCCACCCAGC CTGGGATAGG GGCAGAGGAG GCGAGGAGGC CGTTGCCGCT 

64 51 GATGTTTGGC CGTGAACAGG TGGGTGTCTG CGTGCGTCCA CGTGCGTGTT 
6 5 01 TTCTGACTGA CATGAAA.TCG ACGCCCGAGT TAGCCTCACC CGGTGACCTC 

55 51 TAGCCCTGCC CGGATGGAGC GGGGCCCACC CGGTTCAGTG TTTCTGGGGA 
5 601 GCTGGACAGT GGAGTGCAAA AGGCTTGCAG AAC TTG AAGC CTGCTCCTTC 

56 51 CCTTGCTACC ACGGCCTCCT TTCCGTTTGA TTTGTCACTG CTTCAATCAA 

57 01 TAACAGCCGC TCCAGAGTCA G TAG TC AATG AATATATGAC CAAATATCAC 
67 51 CAGGACTGTT ACTCAATGTG TGCCGAGCCC TTGCCCATGC TGGGCTCCCG 
5801 TGTATCTGGA C AC TG T AAC G TGTGCTGTGT TTGCTCCCCT TCCCCTTCCT 

58 51 TCTTTGCCCT TTACTTGTCT TTCTGGGGTT TTTCTGTTTG GGTTTGGTTT 
5 9 01 GGTTTTTATT TCTCCTTTTG TGTTCCAAAC ATGAGGTTCT CTCTACTGGT 
69 51 C C TC TT AAC T GTGGTGTTGA GGCTTATATT TGTGTAATTT TTGGTGGGTG 
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7001 AAAGGAATTT TGCTAAGTAA ATCTCTTCTG TGTTTGAACT GAAGTCTGTA 

7051 TTGTAACTAT GTTTAAAGTA ATTGTTCCAG AGACAAATAT TTCTAGACAC 

7101 TTTTTCTTTA CAAACAAAAG CATTCGGAGG GAGGGGGATG GTGACTGAGA 

7151 TGAGAGGGGA GAGCTGAACA GATGACCCCT GCCCAGATCA GCC AGAAGCC 

72 01 AC C C AAAGC A GTGGAGCCCA GGAGTCCCAC TCCAAGCCAG CAAGCCGAAT 

72 51 AGCTGATGTG TTGCCACTTT CCAAGTCACT G C AAAAC C AG GTTTTGTTCC 

73 01 GCCCAGTGGA TTCTTGTTTT GCTTCCCCTC CCCCCGAGAT TATTACCACC 

73 51 ATCCCGTGCT TTTAAGGAAA GGCAAGATTG ATGTTTCCTT GAGGGGAGCC 

74 01 AGGAGGGGAT GTGTGTGTGC AGAGCTGAAG AGCTGGGGAG AATGGGGCTG 
74 51 GGCCCACCCA AGCAGGAGGC TGGGACGCTC TGCTGTGGGC ACAGGTCAGG 
7 5 01 CTAATGTTGG CAGATGCAGC TC7TCCTGGA CAGGCCAGGT GGTGGGCATT 
7551 CTCTCTCCAA GGTGTGCCCC GTGGGC ATT A CTGTTTAAGA CACTTCCGTC 
7 601 ACATCCCACC CCATCCTCCA GGGCTCAACA. CTGTGACATC TCTATTCCCC 
7 551 ACCCTCCCCT TCCCAGGGCA ATAAAATGAC GATGGAGGGG GCTTGCACTC 
7 701 TCTTGGCTGT CACCCGATCG CCAGC AAAAC TTAGATGTGA G AAAAC C C C T 
7 7 5 1 TCCCATTCCA TGGCGAAAAC ATCTCCTTAG AAAAGC C ATT ACCCTCATTA 
7 301 GGC ATGGTTT TGGGCTCCCA AAA.C ACC TG A CAGCCCCTCC CTCCTCTGAG 
73 51 AGGC GG AG AG TGCTGA.CTGT AG TG AC C A TT GCATGCCGGG TGC AGCATCT 

7 901 GGAAGAGCTA GGCAGGGTGT CTGCCCCCTC CTGAGTTGAA GTCATGCTCC 
79 51 CCTGTGCCAG CCCAGAGGCC GAGAGCTATG GACAGCATTG CCAGTAACAC 

8 001 AGGCCACCCT GTGCAGAAGG GAGCTGGCTC CAGCCTGGAA ACCTGTCTGA 
8051 GGTTGGGAGA GGTGCACTTG GGGCACAGGG AGAGGCCGGG ACACACTTAG 
8101 CTGGAGATGT CTCTAJLAAGC CCTGTATCGT ATTC AC C TTC AGTTTTTGTG 
8151 TTTTGGGACA ATTACTTTAG AAAAT AAG T A GGTCGTTTTA AAAACAAAAA 
82 01 TTATTGATTG CTTTTTTGTA G TG TTC AG AA AAAAGGTTCT TTGTGTATAG 

82 51 CCAAATGACT G AAAGC AC TG ATATATTTAA AAACAAAAGG CAATTTATTA 

83 01 AGGAA.ATTTG TACCATTTCA G T AAAC C TG T CTGAATGTAC CTGTATACGT 
S3 51 TTCAAAAACA CCCCCCCCCC ACTGAATCCC TG T AAG C TAT TTATTATATA 

84 01 AAGAGTTTGC CTTATAAATT TA 
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Murine Seguenz des Nlcht kodierenden RNA-Gens (einschliefilich putaciven 
Promo tors ) 

1 CTTAGAGTTT CGTGGCTTCG GGGTGGGAGT AGTTGGAGCA TTGGGATGTT 
51 TTTCTTACCG ACAAGCACAG TCAGGTTGAA GACCTAACCA GGGCCAGAAG 
101 TAGCTTTGCA CTTTTCTAAA CTAGGCTCCT TCAACAAGGC TTGCTGCAGA 
151 T AC T AC TG AC CAGACAAGCT GTTGACCAGG CACTCCCCCC AACAATATCC 
2 01 TCCCTCTTCC CCCCCCCCAC CCCCGCCCCG TGTGCTCGTT AGGGCAATTG 

2 51 AAAGGACACT CCCATTTTTG GTGCCATTGA TGCCCTGTCC AT AATAGC TT 

3 01 CCCTGACTTT TACACCACCC CAACTCCCAA TCTGAAGGAC .TGGGAGGTGT 
• 251 GATGCAGGAG AAACTATGGG ACTCTTGGGA G AAG AC T ATG GAGTTGGCCA 

401 GTGATTAAGG CCCACTAATT CCAACTGTGG T AG C A C AG AT CTGGCTCCAC 
451 ATCAACCCAA TCCAAAACTG ACAAGGATAT 'TTTGCAAAAA AAGAAAGTGG 
5 01 CACCTGTCTG ATCCAGCTCT GACATGGCTA GAGGTGAGTC CTAAACTGAT 
5 51 GGCTTATAAA CTAGCCTGAG CCACAGAAGA GTATGGCCCA G AG T G AAG TG 
501 TCATCATCTG TTCACAAGGC ATGCTCCCCT AGAAGATAAT GCTAAAGAGG 
551 ■ TGCCATGGAG GCAGCAGGAC AAAGTACAGG CAGGCTAGGT G G AG TC AAGC 
701 CAGGC C TAG T GCCACAGAAC AAGAGAGCAG TCTGACTAGT AATTAAGAGG 
751 G AAG AAA G G A AAATATTCTT CCAATTACTT TCCAGTTCTC CTTTAGGC-AC 
8 0l AGCTTAGAAT TATTTGCACT ATTGAGTCTT CATGTTCCCA CTTCAAAACA 

8 51 AACAGATGCT CTGAAAGCAA ACTGGCTTGA AATGGTGACA CTGTCCCACA 

9 01 AGCCACCAGA CATGGCAGTG TTCAGAACTA CCTGTATCTG TAT AT AC C T G 
951 CGCTTGTTTT AAAGTGGGCT CAGCACATAG GATTCCCAAG AAG C TC C G AA 

10 01 ACTCTAAGTG TTTGCTGCAA TTTTATAAGG ACTTCCTGAT TGCTTTCTCT 
1051 CTCGTCCTTC CATTTCTTCC TTCCTTCCAT TTCATGCTTT CATTTCTTCC 
1101 CCTAGCTTCT AGTTGTTTCT TCTGTTCCAG GCAGCTGCAG TGCTGAACCA 
1151 CATGGTTACC T AAC AG C AG T CAGCTGCAGC CCTAGGATTC TTCCTGCCCT 
12 01 T T AAC T T C C C ATTGCCAGTG CCAGGTATCA TATTTAACCT TGAGCAAGAG 

12 51 CTGGGCTCTT TTGAGCCCTC CCTAACCTCT G TG AAG AAG A ACAAGAAGGT 

13 01 AGGAAGCTCT TGCTCTTGCT AAGAAAAATG TCAAAAGGCT TT C AG AC C TT 

13 51 AAACAATGAG CCTTTTCACC TTTTACTCTA G AAAAG TGG A C T AG AAAATC 
1401 TGGGTCACAT TGGGTAGCTG AAGGAGATAC AGAGGCCCCT ATGGCCTGCC 

14 51 AGAGTCGTTG C ATGGCC CAA CAGGGGCTCC ATGC C C ACTA CCCTTGACCC 

15 01 TACTCAGAAA TC TAATGTC A T A C TT AG TG T GGGCAGGGGA CCTGTCAGGA 
15 51 CAGATGCAGA CCTAAGCAGG GAG TG AC AC C AGGGCCCTTG GCCCTTCTTC 
1501 TGACAAACAT ACACATCCCA AGTCTTTTTC TAGTGGAATT CTTAACCTCT 
1551 TGCTCACTGG GG AC TGGGAA GCATCAGCAC ATC C CAT ATT TCAAACTCTG 




17 01 CTCCATAAGT ACAGTGGTGA ATTTTATAGA CTTGACTTTG CTGTGGGGTT 
1751 TTAATTGGTC AGTTTTAATT TGGGATCCCA ' AAGTTTTAAC CTCCATTCAG 
1801 GAAGTCCTTA TCTAGCTGCA TATCTTCATC AT ATTGG TAT ATCCTTTTCT 
1851 GTGTTTACAG AGATGTCTCA TATCTATCGA AATCTGTCTG AGAAGTACCT 
19 01 TATCAAAGTA GCAAATGAGA CAGCAGTCTT ATGCTTCCAG AAACACCCAC 
19 51 AGGCACGTCC CATGTGAGCT GCTGCCATGA ACTGTCGAGT GTGTATTGTC 
2 001 TTGTGTATTT TCGTTAACGT TCCCCAGCTT CCTTCCTGCG GTGTAATCAT 
2 051 GGAAGAGTGA AACATCATAG AAATCGTCTA GCACTTCCTG GCCAGTCC^ 
2101 AGTGATCAGG AACCGTAGTT GACAGTTGCA ATTGATAGCT TAAGATAAAA 
2151 CCATGTTTGT CTCTTATGGA ATGGTTAGAA CTAAGTGAGA GATCTTGCCC 
2 2 01 CATTCTGTTT GCCGAATCAT AGTTGGACTT TTAGTGTATT TGTATCCATT 

22 51 TCCTTGTGCT ATAAAAGCAA ACCCTGCAAC CAGCTTTCTG TCAGGCAGTC 
2 3 01 CTTTTGCCTG CTCTGCTTTT GATCCTCTTA GTCTTGCTTC TGGTTCGTCC 

23 51 CTGGAGAGGG AGGAGGGGTC AGAAGAGGAA TTCTGGAGGA TCCAGGATAT 
2 401 GTCCTTCTGA ACTCGTGCTT CTTCCAGTGA CAAAAGGCCC CTACTGCCCC 
2 451 ACCCCAACCT GCCCCATGCA CTCCTCTAGG ACACCTTTCC A T AC TTTTC A 
2 501 CAACACCTAG CCAGGTTGAC ACC.-.AGTTGT TTATTGTGGT CTGCTTGGAA 
2 5 51 TTTTACCTGT TAGGCTTACT TAGTCCAATC AAATGGACTC CAAGTTGGGT 
2 601 ATCCCTCATC TTTGGAAGAC AACCTAGGCT GATTAGATAT TTACTTTTGG 
2 551 GATTGCAGCA CTTTGGGTGC CGTTTTTCTT TTACTTGGGT TTTATCTGCA 
27 01 GCTCCCTCAC CACCACCACC ACCCCCCACT TACCTGTATG TAGAACTGAT 
27 51 TTCAAAACTG GAGGTGGTGG TAACTGCAGC TTCTTAGGGT TTTCTTCACT 
2 8 01 TCTTGCTTCT TTCCCCATTC CCTCATCCAC AAATAAGGGC ATCACAAGTC 
2851 AGTCTCCTTT AAGCAGGCAG CTTTGGTGGG GTTTTTCCCC TGGAAGCCAG 

2 9 01 GGAGGGTGTG AGGCTGCCTC TGCCTTGTGG TCAGGTTGAC AGGAGGTTGG 
2951 AGGGAAAAGC C TT AAG T CAT GGGATTCTCA CCAGCTGTGT CTGGCTCAGA 

3 001 CCTGGAATGT GACCTTTATT TTGTTGTATT TGAACATTGT AAAGTGTGGG 
3 051 TGGTACCTTA AACTGAATAT GTGAAGAATC CAGAAACTGA CCAACAGCTT 
3101 TCAGATACCT GGGGCTAGGT C AC T AAGG TC ACATCCAGTC TTCCCTACCC 
3151 TGTTCTAGTT GTTAGCTACT ACCTCTCCCA GATAGATTGC TGTATATCCT 
3 201 CCAACTATGA TCATCCTGGC CCAAGCTTGC CTGTTCTTGA GTCTGTCTTA 
3 251 ACCAGTGGAA CTGCTGCCCT TGGTGTGCAG TGAGTTGAGG ACTCTTGGTC 
3 3 01 ACAGCCAGGC TCTAGTAGTA CAGCTCCTTT CTGCTGGTGC TGTATTTCCA 
3 3 51 TATCAAAAGG CACAGGGGAG ATCTAGAAAT GCCATCTCCC CCAGTCCATC 
3 401 AGTGCCAAAC AAGCC CATGA TCCCAGCATG GGTACAGACA ACTCTGTTCA 
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3 451 GTGCTATCAC AACAGACTAG AGGCCATGAA CATTGGACGT GGGAACCAGA 

3 5 01 ' GCAACCCGAA TTGCTGCTGC TTTATTCAGC TTTCCGTTGC TCTGACAATG 

3 551 ATAAAACAAG GCAGTAACTT AAAACAGACT GCCAGGTTTG G C AG AGAAAG 

3 501 G AAATTC CTT AGCTGACAGC ACCTCTGGAT TTTAAATAGG TTGTAATAAG 



3 701 AGACCAGCCT GATTTCATGC AGCCCAAATG GAGTCCAGCT GTCTGAACTC 



3 801 AGGCTGAGGA GACATCACAG GTGCCAGTTC TTCAAGAAGA CTTTTGTGCA 

3 851 TCAGTTCATA GCCTATATCT TTGCCCAAGA TTGTAGATTC AGGTTAACAC 

3 901 TA.CAGATTCT AGGGCAGATG ACTGAGACTC AGAJLAAAAAG CCCCTGTGGA 

3 951 CTGTGGTATA GCGAAGTACA AAAAC TG AAG GGGGGTAGGG CAGATGCCGC 

4 001 ATGCCTCATG CCAGAGCCAA GCCCTCTGCT CCATCCACAT CCTTTTCTGG 
40 51 CTCCTTCTTC CTGCTCTCTG CTTCAGTGAA CCAGCCCCAC TCTGAAGAGA 
4101 TTTGTTGATT CTCTCCATTT TTATGTCTTT CTCTTTTAGG T AC TATA TAG 
4151 AAAAGGCTTA GTCTAATTGT TATAAATTGC TAGAATACTG CCTCCCCCAG 
4 2 01 GGTCTAAAAA TATA.TGCTAA AGGGG AAAAC TTGAACACTG AAACCAGTTC 

42 51 TGAACAATTT AGAAGGAAAA CCTTGAAAAC A.TTTAA.CAAA. AAA TT AT ATT 

43 01 TTAATGTTTA TGAATAAGAG GAGGCTTTTG AAAAAATGTT GA.TCTATAAA 

43 51 TACTTACTTT AGGCCTGAGG TGTCTAATGA GTGAACTGAG CAATGGGAAC 

44 01 TCAAGGCTGA AGCCTCCTGC ATCAGAGGAG G TAG AAC C AG GAGCCTCTTG 

44 51 AGATTTGAGG TGTTTTAGCA TTGGAAAGCC ACTCTTTGGG TAGCTGGCCC 
4501 CAGAAACTAC TTCTGACCTT GTCATTTGGA ATGGAGGTTA GTGGTCTGCC 

45 51 AGATGCCAAA GCTGCATGAG ACCAGCTCTT GGTTTATCAA TTTGAACACT 
4 6 01 CAGTAACCTA GAAGGCCCAG CACAAAGTGT CTGCTCTCTT C T T AAC TG AG 
4651 CCTGCCCCAG CACTACTGCA CAAATTAGGC- AGGGTCTACT TCCTACAGAG 
4701 CATCCCTCCC TGGGCCCCCT CCCATCCTTT GTACTCTACC TACCTGACCT 

47 51 TCAGGATCTT GGCACATACG AAATGGCTGT GTAGCAAGCA CTTTGGCATG 
4 801 CCCTCCTAAA CTTACCCCAG AGCCTCTCCC TGCCTCCTTA AGCCAGTCTG 

48 51 CCTGTCTTCT GGGGAGGTGT T AG AGC C CAT AGAATGGAGA GGAGAAAGAA 

49 01 AAG A GG AAG A GGCAGGCAGG TAG T AAAAAG GCTCTGGGAG GAAAGACAGC 

49 51 CTCCTAGGCT TTGCACAAGC AGG AC TC AGC CCCTTGTGGG AACTAAGTGC 
5001 CATCTTGGAG TTTAAGAACA TTTGGACAAG TTGCAAATGA CCTTTGCTCC 

50 51 TTGCTCCTCT CACCTTTTAT GGGGCCCTGC TTAGCACTGA AAGCAAATGC 
5101 GCTGAAAAGG CAAAGAGGTT TGGCTCCTGC C C AC TG AT AG TCCTTTCCCT 
5151 GCAGTGTTTG TGTGTCAAGT GGCAAAGCTG TTCTTCCTGG TGACTCTGAT 
52 01 TAGATCCAGT AACTTAAGAG ATTTGTATGC ATAGGTCTGC TTTGACTCTT 



3651 



TGGCTCAAAC CCATCCAGGA AAAAGCAAAA GGGTTAGAAC TGACCAGATG 



3751 



TGCAGC AC TT CTCTACTACA _GTCTCCTAGA GCATTCCAGC CAGGCTCTTC 
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52 51 CTATTCTGGG CTTTTGATTT GTTTTTC AG T TTTGCTTTTA GTTTTCCTAT 

53 01 TTTTATTTTA TGCACCAACT AGACACACAA AGCAGTTGAA TTTATATATA 

53 51 TATATATATA TATATATCTG TATATTTCAC AATTATAAAC TCATTTTGCT 

54 01 TGTGACGCCA CACACACACA AAAAGAAAAA CCTTTTAAAA TT AT AC C TG T 
54 51 TGCTTAATTA CAATATTTCT GATAACCATA GAGTAGGACA AGGGAAAAAA 
5 501 TTTAAAAAAA AAAAAAAAAA AAGAAAAAAC ACATCTGTCT GCTGGTCACT 
5 5 51 TCTTCAATCC AAGCAGATCT GTGATCTTTC CTCGCGTCTT TCAAAGACTT 
5 601 CCCTGTGCTA AGTGAAGGAA GCTCCAGGCT GCACCCAGGT TTTGTGCTTT 
5 651 GTTTCTCCTC TG T TG TG AAA GGGGCCCCAA GATTCTGGGT ACAGGACAGT 
5 701 TCATTTCAGC ATGGGGTCAG G AG AC AAG AG CACTCCCTTT AC ATGC TG AC 
5751 G T AC AG AAC T TAGTGGGAAT AGCCTAGTCC CCACCTCTAG GGATGGGGAG 
5 301 CTAGCATGCA TGGGGGTGAC CCAACTCCCT CCACCTTTCC CTGGCCAGGA 

58 51 AGAGCCTGTG T AC AG T AAG T CTGACAAGCT TTCCCCAGTT AGCAGGGCTC 
5901 AGAGCATTTA AAAACCCTCC AAACTTTGCT GAGTCTAGGG AC TAG AG AG A 

59 51 AGATAGAAGA TTTGGTCTAT CTCCAAGGTG TGT AAG C TG T A C C AG G TAG A 
5001 ATGCCAGGGA CCCCAGAACC AC ATC C AAC A GC CCAATGGG TCTCCTCCAG 
50 51 AAAG T AG TG A AG ACT C C AG A AAC ATCC CTT TCTCTTCTCC CTGCTCCCAT 
5101 GAGTAACTGC ATTTGCTTTT GTAATCCTTA ATGAGCATTA T C TG C T AAAA 
5151 AAAAAAAATT AG C TG T AAC A G TTC TTTTTG CAAAAGGATC ATTC TT AAAT 

62 01 AATTAAAAAC ACCCCCCCCC CAAAAAAAAG TC C AG AAC C T TGTTCTTCCA 

52 51 AAGCAGAGAG CATTATAATC AGGGCCAAAA TCTGTCCCAC ACCTCTACCC 

63 01 CATCTCCTCA TGATTGCTGC TTCTAAGGCC AGAATACAGC AAAGATATTT 

53 51 G TAGGC C C TT TGGGTGACTG GGCTACCCTT GGAGCTCTTG GAAGATGGGC 
5401 TGGGGAAGCC TCTGAGACCC TATCCTAGGG CCTTGCTCTA GGGAGTAATC 

54 51 AGTATTAGTA GAGTGTCACA AC ATT ATTC C CCAGCCGGCA TGAGATGGGG 
5501 G C AG AAG AAG C C AAAGGG TT GTCTCCACTG CTACTTACTT GGCCACTGAC 
65 51 AGGTAGGTGA CCATGTATGT CCATATGCAT GTTTTATGGC TG ATG TG AG A 

5 601 TCAGCACCCA AGTTAGCTTC ACCTGGTGAC CTCTAACCCT GCCTGGATGG 

6 651 AGCAGGCCAC CTGGTTCAAT GTTTCTGGGC AGCTGGACAA TGGAGTGCAA 
6701 AAGGCTTACA GAACTTGAAG CCTTTTCCTT ACTTTGCTAG CACGGCCTCC 

67 51 TTTTCCATTT G ATTTG TC AC TGCTTCAGTC AAT AAC AGC C GCTCCAGAGT 
5801 CAGTAGTTGA TGAATATATG AC C AAAT ATC ACCAGGACTG TT AC TC AAC G 

68 51 TG.TGCCGAGC CCTTTCCTTG TGCTGGGCTC CCTGTGTACC TGGACACTGT 
5901 AATGTGTGCT GTGTTTGCTC TCCTTCCTCT TCCTTCCTTG CCCTTTCCTT 
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7 001 TGTGTTCCAA "ACATGAGGTT TTCTCTACTG GTCCTCTTTA ACTGTGGTGT 

7 051 TGAGGCTTCT ATTTGTGTAA TTTTTGGTGG GTGAAAGGAA CTTTGCTAAG 

7101 TAAATCTCTT CTGTGTTTGA AATGAAGTCT GTATTGTAAC T ATG TTT AAA 

7151 GTAATTGTTC CAGAGACAAA TGCTTCTAGG TACATTTTCA TTACAAACAA 

72 01 AGCATTTGAA GGGAGGGAAG TGGTGAATAA GACAAGAGGG GCAATCTGAA 

72 51 TTGATCCCTG CCCAGATCAG CCAGAAGCTA CCAAAAGTTA AGCACTGGTT 
._.7. 3 .01 _ 1TTCCATTCCA _AGTC^ 

73 51 CAAAGCAAAA CCAGCTTTTC CACCCAATGG ATTCTTTGCT TCTCCTTCCC 
7 401 AGATTATTAC TACTGCTGTA ATAATCTAGG AGTGCCAGGA GGG AAAGGAG 

74 51 TATTAACACA GAGCTGTGCT CACTGAGTAT GGAAAGGCTT GGTCTGAGTT 
7 5 01 TTCAGGAGGA TG AC C C AC TG TGGACATGGG GAGAAGACAG AAGATAAATT 
7 5 51 AGCCGCTCCC TGCCTAAGAT ACCTCTTAAT AGATAAGTCA AGGCCATGGA 
7 601 CATTATTGTC TACAAGGCAT GTTTCAAAGA CATGACCAGT CAGGACACTT 
7 651 CTGTCATACT CCATGTTGCC C C C TAG T AC A CAGTACTAAT CTGATATCTC 
77 01 TGTTCCCGCC ATG CCTGGGG GATAAAATGA TAG C AG AG AC TCCTTTCCTT 

77 51 CAATGTGATC T AATTC C C AA CAAAATCTGG GC C TG AG AT A C C A C C TG TTT 
7 3 01 CTATGGCAAA CATC C T C AG T AAAG TG TT AT TCTCATTGCA GATTGTTCCA 

78 51 GCCTAATGTA AGAGGAACAG AGCAGTGTTC CCTTGGAGCC TC ATG TGG AC 
7 901 AGTTCTACCT G T AG TG AC C A GTTGGCTATA G TAG TT ATT A GCTGGAACAA 

79 51 CCAGACAGGG TACATGCCCC CTCCAAAATC CATGTTGTAC TCCCCTCTGC 
3001 CAGCCAGGGG GGGTGAGATC TG T AG AAT AG TGCAGCCAGT GACAAGCCAC 
3 051 CTTGTGTTTG TCACCAGCTC AAAAACTCAT CTAAGGTTGG GAGCAGGCAG 
8101 ACAAGGCAGA GAGAAAGATC CAGGACAGAC CTAGCTGGGC TGGAGGGGTC 
3151 TTGAAAAGCC CTCTGTCGTA TTCACCTTCA GTTTTTGTGC T TT G GG AC AA 
3201 TT AC TTT AG A AAATAAGTAG G T C G T TTT AA AAACAAAATA TTGATTGCTT 

32 51 TTTTGTAGTG TT C AAAA C AA AAGGTTCTTT G TG T A TAG C C AAATG AC TG A 

33 01 AAG C AC TG AT ATATTTAAAA A C AAAA G G C A ATTTATTAAG GAAATTTGTA 
S3 51 CCATTTCAGT AAAC C TG TC T G AATGTAC CT GTATACGTTT CAAAAACACA 
8401 CCCCACTGAA CCCCTGTAAC C T ATTT ATT A TAT AAAG AG T TTGCCTTATA 
8451 AATTTACATA AAAA 
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.GTTGGAGCATTGGGGATGT 



1 CTTAGAGTTTCGTGGCTTCAGGG' 
1 

5 1 TTTTCTTACCGACAAGCACAGTCAGGTTGAAGACCTAACCAGGGCCAG AA 

101 GTAGCTTTGCACTTTTCTAAACTAGGCTCCTTCAACAAGGCTTC 
100 

151 ATACTACTGACCAGACAAGCTGTTGACCAGGCACCTCCCC 

150 TC CAACAATATC 

191 TCCCGCCCAAACCTTTCCCCCATGTGGTCGTTAGAGACAGA 

200 CTCCCTCTTC C CC--.-CCC£ G C 

232 GCGACAGAGCAGTTGAGAGGACACTCCCGTTTTCGGTGCCATCAGTGCCC 
241 — G— -A A A T TGA 

282 CGTC. . .TACAGCTCCCCCAGCTCCCCCCACCTCCCCCACTCCCAACCAC 
286 T CATA-T T TGA--.TTTA A A . .T- 

329 GTTGGGACAGGGAGGTGTGAGGCAGGAGAG ACAGTTGGATTCTTTAGAGA 
333 TGAA T T A--TA-G C GG 

379 AG. . . ATGGATATGACCAGTGGCTATGGCCTGTGCGATCCCACCCGTGGT 
383 --ACT- GT--G AT- -A .CACTA--T A-T 

426 GGCTCAAGTCTGGCCCCACACCAGCCCCAATCCAAAACTGGCAAGGACGC 
432 A--A--GA T T— .A A TAT 

476 TTCACAGGACAGGAAAGTGGCACCTGTCTGCTCCAGCTCTGGCATGGCTA 
481 --TG--AA-A-A A A 

52 6 GGAGGGGGGAGTCCCTTGAACTACTGG . GTGTAGACTGGCCTGAACCACA 
530 . . --A--T ..-A GA CT-A A A G 

575 GGAGAGGATGGCCCAGGGTGAGGTGGCATGGTCCATTCTCAAGGGACG . T 

576 -A T A A T CA TG A C-T-C- 

624 CCTCCAACGGGTGGCGCTAGAG GCCATGGAGGCAGTAGGACAAGGT 

62 6 --C-T-GAA-A-AAT A — AGGT C A-- 

GCAGGCAGGCTGGCCTGGGGTCAGGCCGGGCAGAGCACAGCGGGGTGAGA 
A A _ , G A A A CT--TG-CA-A-AACA-- . 

GGGATTCCTAATCACTCAGAGCAGTCTGTGACTTAGTGGACAGGGGAGGG 
4 ACTAG — A- 

770 GGCAAAGGGGGAGGAG AAGAAAATGTTCTTC CAGTTACTTTC C AATTCTC 
744 . . .T A A — A-G A A G 

820 CTTTAGGGACAGCTTAGAATTATTTGCACTATTGAGTCTTCATGTTCCCA 
791 

870 CTTCAAAACAAACAGATGCTCTGAGAGCAAACTGGCTTGAATTGGTGACA 
841 A A 

920 TTTAGTC C C TC AAGCCAC CAGATG TGACAGTGTTG AG AACTACCTGG ATT 
391 C-.. A CA--G C T--C 

970 TGTATATATACCTGCGCTTGTTTTAAAGTGGGCTCAGCACATAGGGTTCC 

L 0 2 0 CACGAAGCTCCGAAACTCTAAGTGTTTGCTGCAATTTTATAAGGACTTCC 
987 —A 

1070 TGATTGGTTTCTCTTCTCCCCTTCCATTTCTGCCTTTTGTTCATTTCATC 
1037 c CTCGT T CCT-C G 

1120 CTTTC ACTTCTTTC C CTTCCTCCGTCCTCCTC CTTC CTAGTTCATCC CTT 
1087 T C AG- -T . G-TT 

1170 CTCTTCCAGGCAGCCGCGGTGCCCAACC ACACTTGTC 

1122 — G T — A TG ACATGGTTACCTA GCA 

12 07 GGCTCCAGTCCCCAGAACTCTGCCTGCCCTTTGTCCTCCTGCTGCCAGTA 
* * 22 A G . T — G-T T AA-T CAT G 




CCAGCCCCACCCTGTTTTGAGCCCTGAGGAGGCCTTGGGCTCTGCTGAGT 
. • GT-T-A-A . .-A--T C-A-AGC TT C 

CCAACCTGGCCTGTCTG . TGAAGAGCAAGAGAGCAGCAAGGTCTTGCTCT 
TC---AA- — C-G--AA A AG-T--G C 

13 56 CCTAGGTAGCCCCCTCTTCCCTGGTAAGAAAAA . . GCAAAAGGCATTTCC 
1317 --C TGT . A 

1404 CACCCTGAACAACGAGCCTTTTCACCCTTCTACTCTAGAGAAGTGGACTG 
1345 G T-A T . T A A 

1454 GAGGAGCTGGGCCCGATTTGGTAGTTGAGGAAAGCACAGAGGCCTCCTGT 
13 94 —AA-T T-AC— G C A-G -GAT . — -A- 

1504 GGCCTGCC . . AGTCATCGAGTGGCCCAACAGGGGCTCCATGCCAGCCGAC 
1443 AG G-T-CA CA-TAC- 

1552 CTTGACCTCACTCAGAAGTCCAGAGTCTAGCGTAGTGCAGCAGGGCAGTA 
1493 CT A--T-AT ATA-T ....T .. 

1602 GCGGTACCAATGCAGAACTCCCAAGACCCGAGCTGGGACCAGTACCTGGG 
1537 . . --G TG - C AG - - CAGATG C TA A GTGAC A 

1652 TCCCCAGCCCTTCCTCTGCTCCCCCTTTTCCCTCGGAGTTCTTCTTGAAT 
158S C--TTG T ACAAA-A-ACA-ATC-CA CT- -T-CT-G- 

1702 GGCAATGTTTTGCTTTTGCTCGATGCAGACAGG . . . GGGCCAGAACACCA 
1635 — A-T-C — AAC--C AC — GG T--GAA-CAT C T-C 

17 4 9 CACATTTCACTGTCTGTCTGGTCCATAGCTGTGGTGTAGGGGCTTAGAGG 
1685 --T . . . . AAC C AG-ACA GT-AATT T--A 

1799 CATGGGCTTGCTGTGGGTTTTTAATTGATCAGTTTTCATGTGGGATCCCA 
1731 -T — ACT G G A T 



1849 TCTTTTTAAO 
1781 AAG--- 



lGGAAGTCCTTATCTAGCTGCATATCTTCATC 



1899 ATATTGGTATATCCTTTTCTGTGTTTACAG AGATGTCTCTTA . . TATCTA 
1831 A--TC G- 

1881 ^ TCTCTCC ^ C1 ^ G ^ GTACC ^ AT 

1997 TCTTATGCTTCCAGAAACACCCACAGGCATGTCCCATGTGAGCTGCTGCC 

2047 ATGAACTCTCAAGTGTGTGTTGTCT/TGTGTATTTCAGTTATTG . TCCCTG 
1977 — - - ----G- - -----A-- - - — — — - — -TC-- AC-T CA 

209 6 GCTTCCTTACTATGGTGTAATCATGAAGGAGTGAAACATCATAGAAACTG 
2027 C--GC G-A TC- 

214 6 TCTAGC^CTTCCTTGCCAGTCTTTAGTGATCAGGAACCATAGTTGACAGT 
2077 G C G 

2196 TCCAATCAGTAGCTTAAGAAAAAACCGTGTTTGTCTCTTCTGGAATGGTT 
2127 TGA A A A 

2246 AG ... . AAGTGAGGGAGTTTGCCCCGTTCTGTTTGTAGAGTCTCATAGTT 
2177 — AACT A— TC A CC— ..A 

2292 GGACTTTCTAGCATATATGTGTCCATTTCCTTATGCTGTAAAAGCAAGTC 
2225 . TG T A G A AC- 

2342 CTGCAACCAAACTCCCATCAGCCCAATCCCTGATCCCTGATCCCTTCCAC 
2274 GCT-T-TG G- - G T TTG- 

23 92 CTGCTCTGCTGATGACCCCCCCAGCTTCACTTCTGACTCTTCCCCAGGAA 
2308 TT T--T-TT — TC-TG GT — C TG-AG- 

2442 GGGAAGGGGGGTCAGAAG AG AGGGTGAGTCCTCC 

23 58 G-A GAATTCTGGAGGATCC A-AT T- 

2 47 6 AGAACT. . . . CTTCCTCCAAGGACAGAAGGCTCCTGCCCCCATAGTGGCC 
2408 T CCTG T GT A C A-TG CC- . . . 

2522 TCGAACT . . . CCTGGCACTACCAAAGGACACTTATCCA . CGAGAGCGCAG 
2454 C-A-C--GCC--AT C-TCT C-T TACTTTT-A — A 

25 68 CATCCGACCAGGTTGTCACTGAGAAGATGTTTATTTTGGTCAG . TTGGGT 
2504 — C-TAG A ...C T G T-C AA 

2617 TTTTATGTATTA . . , . TACTTAGTCAAATGTAATGTGGCTTCTGGAATCA 
2551 CC-G GGCT C CA 

2663 TTGTCCAGAGCTGCTTCCCCGTCACCTGGGCGTCATCTGGTCCTGGTAAG 
2586 -AC AA — TGGG - ATCCC -T-G 

2713 AGGAGTGCGTGGCCCACCAGGCCCCCCTGTCACCCATGACAGTTCATTCA 
26 19 ~ — AC-T 

2 7 6 3 GGGCCGATGGGGCAGTCGTGGTTGGGAACACAGCATTTCAAGCGTC . ACT 
262 6 A T TA-AT-T-TACTT TTG C- -TGG-T-C-GTT- 

2812 TT ATTTCATTCGGGCC CCAC CTGCAGCTCCCTCAAAGAGGCAGTTGCCCA 
2676 --C T-C-T TTTT-T . .-CCAC — CCAC-A-C 

2 862 GCCTCTTTCCCT TC CAGTTT ATTC CAGAGCTGCCAGTGGGG . . . C 

2724 C— CAC--A GTATG-AG-AC-G T--A-A AG T-GTAA 

2 904 CTGAGGCTCCTTAGGGTTTTCTCTCTATTTCCCCCTTTCTTCCTCATTCC 
2774 CA T .. TC-C TTG CT C 

2954 CTCGTCTTTCCCAAA . . . . GGCATCACGAGTCAGTCGCCTTTCAGCAGGC 

2 822 A — . . . -A TAAG A T A 

3 000 AGCCTTGG . CGGTTTATCGCCCTGGCAGGCAGGGGCCCTGCAGCTCTCAT 
2869 T TG— G— T-TC A— C A — G 

3 049 GCTGCCCCTGCCTTGGGGTCAGGTTGACAGGAGGTTGGAGGG . AAAGCCT 
2913 T T A 

309 8 TAAGCTGCAGGATTCTCACCAGCTGTGTCCGGCCCAGTTTTGGGGTCTGA 
2963 TCATG T T ACC AA-G 

3148 CCTCAATTTCAATTTTGTCTGTACTTGAACATTATGAA. . GATGGGGGCC 
3013 -- -TT T G . A . . GT . TG . . T . . TA 

319 6 TCTTTCAGTGAATTTGTGAACA . . GCAG . AATTGACCGACAGCTTTCCAG 
305 6 C AA-C A G-ATC A--C A AGA 

3243 TACCCATGGGGCTAGGTCATTAAGGCCACATCCACAGTCTCCCCCACCCT 
3106 . . C T . . T T . 

3293 TGTTCCAGTTGTT AGTTACTAC CTCCTCTCCTGACAATACTGTATGTCGT 
3151 T C TC-CAGAT-G-T-G A--C- 

3343 CGAGCTCCCCCCAGGTCTACCCCTCCCGGCCCTGCCTGCTGGTGGGCTTG 
3201 -C-A-- AT-A--AT — TGG AAG-T T-CT — A-TC-- 

3393 TCATAGCCAGTGGGATTGCCGGTCTTGACAGCTCAGTGAGCTGGAGATAC 
3246 — T — A A-C T-CC . GT-TG T- -AG — CT- 

3443 TTGGTCACAGCCAGGCGC . . . TAGCACAGCTCCCTTCTGTTGATGCTGTA 
3295 T-TAG T T C--G 

3490 TTCCCATATCAAAAGGCACAGGGGACACCCAGAAACGCCACATCCCCCAA 
3345 --T G-T-T T TC G 

3 S 4 0 TCCATCAGTGCCAAACTAGCCAACGGCCCCAGCTTCTCAGCTCGCTGGAT 
3395 A C-T-AT A-. 

3590 GGCGGAAGCTGCTACTCGTGAGCGCCAGTGCGGGTGCAGACAATCTTCTG 
3430 a . .C 

3 64 0 TTGGGTGGCATCATTCCAGGCCCGAAG . CATGAACAGTGCACCTGGGACA 
34 47 --CA CT CAA A-TA--G-C T--G--G AC 
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taa^P^c; 



TGCCCAGCTTTTCATTGCT 
l-ATT C-G 



-'3 
23 



3689 GGGAGCAGCCCCAAATTGTCACC 
3497 CA A G--T- G- 

373 9 GTGACAGTGATGGCGAAAGAGGGTAA^WI^CAGACACAAACTGCCAAGTT 

3542 C A . . .A C-A--C-G TTA-A G G 

378 9 GGGTGGAGAAAGGAGTTTCTTTAGCTGACAGAATCTCTGAATTTTAAATC 
3589 T— CA AA C C-C G A 

383 9 ACT . . TAGTAAGCGGCTCAAGC CCAGGAGGGAGCAGAGGGATACGA 

3 63 9 GG-TG--A T A-CCAT AAA A-A--G-TA-- 

3883 GCGGAGTCCCCTGCGCGGGACCATCTGGAATTGGTTTAGCCCAAGTGGAG 
3689 A-T-- -CAGAT-A G-CT — T — CA-GC A 

3933 CCTGACAGCCAGAACTCTGTGTCCCCCGTCTAACCACAGCTCCTTTTCCA 
3734 T-CAG-T-T-T CAG-A-TTC . — T .... -C-C-T- 

3983 GAGCATTCCAGTC AGGCTCTCTGGGCTGACTGGGC CAGGGGAGGTTACAG 
3779 C TCA ---A--CA-C 

4033 GTACCAGTTCTTTAAGAAGATCTTTGGGCATATACATTTTTAGCCTGTGT 
3821 --G C CT T-- . . --CAG--CA A-A- 

4 0 83- CATTGCCCCAAATGGATTCCTGTTTCAAGTTCACACCTGCAGATTCTAGG 
3869 -T A- .... GTA-A G A . --A 

4133 ACCTGTGTCCTAGACT TCAGGGAGTCAGCTGTTTCTAG 

3914 G-AGA — A-TG CAGAAAAAAAGCC-CT-TG-A-T-TG — A-AGC- 

4171 AGTTCCTACCATGGAGTGGGTCTGGAGGA CCTGCCCGGTGGGG 

3 964 -AG-A-A-AA-CT--AG G — A-G-C-GATGCCG-A TCA — CCA 

4214 GGGCAGAGCC . . CTGCTCCCTCC GGGTCTTCCTACTCT 

4014 -A — CA CT A ACATCCTTTTCT — C — C-T — T- . — 

4250 TCTCTCTG CTCTGACGGGATTTGTTGATTCT 

4 063 G CTTCAGTGAACCAGCCCCA A-A 

4281 CTCCATTTTGGTGTCTTTCTCTTTTAGATATTGTATCAATCTTTAGAAAA 
13 TA G— C-A— 

GGCATAGTCTACTTGTTATAAATCGTTAGGATACTGCCTCCCCCAGGGTC 
T A T-C---A 

TAAAATTACATATTAGAGGGGAAAAGCTGAACACTGAAGTCAGTTCTCAA 

4431 CAATTTAGAAGGAAAACCTAGAAAACATTTGGCAGAAAATTACATTTCGA 
4255 T AA— A T TAA 

4481 TGTTTTTGAATGAATACAAGCAAGCTTTTAC AACAGTGCTGATCTAAAAA 
4305 . . . . AG--G-G GA — A-A--T T 

4 531 TACTTAGCACTTGGCCTGAGATGCCTGGTGAGCATTACAGGCAAGGGGAA 
4351 . -TT-A G — T — AA TGAACTGA T 

4 581 TCTGGAGGTAGCCGACC 

4 450 G AGATTTG AGG TGTTTT AGCATTGG AAAGCCAC TTG T-G-- 

459 8 TGAGGACATGGCTTCTGAACCTGTCTTTTGG GAGTGGTATG 

4500 CC- . — A-CTA C-T A AATGGAGGTT C-- 

4639 GAAGGTG GAGCG 

4 549 CC - - A — CCAAAGCTGCATGAGACCAGCTCTTGGTTTATCAATTT- -A-A 

4651 TTCACCAGTGAC CTGG AAGGCC CAGCACC AC CCTC CTTCCCACTCTTCTC 
4599 C- . . . A A A-AGTGT — G- 

4701 ATCTTGACAGAGCCTGCCCCAGCGCTGACGTGTCAGGAAAACACCCAGGG 
4 639 T A — T A — — TGCACA 

4751 AACTAGGAAGGCACTTCTGCCTGAGGGGCAGCCTGCCTT . . GCCCACTCC 
4673 — T G GT — A — T ACA-A T — CT — C-GG C 

4799 .' . TGCTCTGCTCGCCT CGGA 

3 CATCCTTTG-A A-CTA GACCTTCAGG ATCTTGGCACATA — A - 

TCAGCTGAG CCTTCTGAGCT GG 

ATG T - TAGCAAGCACTTTGGCATGC C — A-A — TACCCCAGA- 

CCTCTCACTGCCTCCCCAAGGCCCCCTGCCTGCCCT 

23 C TT C-AGT T - T - CTGGGGAGGTGTTA 

4875 GTCAGG AGGCAGAAGGAAGCAGGTG 

4873 G AGC CCATAG AATGGAGAGGAGAAA - AA- A A G-C-G A 

4900 TGAGGGCAGTGCAAGGAGGGAGCACAACCCCCAGCTCCCGCTCCGGGCTC 
4923 GT-AAAAG-CT-TG A- AG G — T--TAGG- 

4950 CGACTTGTGCACAGGCAGAGCCCAGACCCTGGAGG AAATC CTACC 

49 60 -T A GA-T C T-T — GAACT- -G-G-C-T- 

4995 TTTGAATTCAAGAACATTTGGGGAATTTGGAAATCTCTTTGCCCCCAAAC 
5005 — G — G--T AC — G C GA-C — TG-T — TTG- 

5045 CCCCATTCTGTCCTACCTTTAATCAGGTCCTGCTCAGCAGTGAGAGCAGA 
5055 T — — TC T--GG — C T C A A- 

5095 TGAGGTGAAAAGGCCAAGAGGTTTGGCTCCTGCCCACTGATAGCCCCTCT 
5098 --C-C A .T T- 

5145 CCCCGCAGTGTTTGTGTGTCAAGTGGCAAAGCTGTTCTTCCTGGTGACCC 
5147 T t- 

5195 TGATTATATCCAGTAACACATAGA . . . CTGTGCGCATAGGCCTGCTTTGT 
5197 G TT- . GATT AT T A 

52 42 CTCCTCTATCCTGGGCTTTTGTTTTGCTTTTTAGTTTTGCTTTTAGTTTT 
5246 T T A T C 

5292 TCTGTCCCTT*TTATTTAACGCACCGACTAGAGACACAAAGCAGTTGAATT 
5296 C--A- . . . T-T A 



5342 

5343 TATATATATj 



53 80 ATTTTGCTTGT( 
5393 



W 

'GTGGCTCC 



TATATATATCTGTATATTGCACAATTATAAACTC 



TCCACACACACAAAAAAAG . . . . ACCTGTTAAAATT 
C AAAA T 

5426 ATACCTGTTGCTTAATTACAATATTTCTGATAACCATAGCATAGGACAAG 
5443 AG 

547 6 GGAAAATA . AAAAAAGAAAAAAAAGAAAAAAAAACGACAAATCTGTCTGC 
5493 A-TTT A A G AA C 

5525 TGGTCACTTCTTCTGTCCAAGCAGATTCGTGGTCTTTTCCTCGCTTCTTT 
5543 AA CT A--. G 

5575 CAAGGGCTTTCCTGTGtfcAGGTGAAGGAGGCTCCAGGCAGCACCCAGGTT 
5592 A-A C T-A A T 

5625 TTGCACTCTTGTTTCTCCCGTGCTTGTGAAAGAGGTCCCAAGGTTCTGGG 
5642 TG-- . TC--. G--C A 

5675 
5690 



5692 
5740 

5742 
5786 

5785 
5833 

5835 
5878 

5881 
5928 

5930 
5978 

5980 
6028 

6029 
6078 

6077 
6128 

6122 
6178 

6158 
6228 

6208 
6275 

6244 
6325 

6294 
6373 

6344 
6421 

6392 
6471 

6442 

6521 

6488 
6571 

6538 
6621 

6588 
6669 

6638 
6719 

6687 
6769 

6737 
6819 

6786 
6869 

6835 
6919 

6885 
6969 

6935 
7017 

6984 
7067 

7034 
7117 

7084 
7167 



TGCAG GAGCGCTCCCTT 

-A GACAGTTCATTTCAGCATGGGGTCAGGAGACAA A 

GACCTGCTGAAGTCCGGAACGTAGTCGGCACAGCCTGGTCGCCTTCCACC 
T — A C--A-A T G — A-T A . . . .C 

TCT . . GGGAGCTGGAGTCCACTGGGGTGGCCTGACTCCCCCAGTC 

AGGGATG A-CA-G--TG A — CA T- . . 

CCCTTCCCGTGACCTGGTCAGGGTGAGCCCATGTGGAGTCAGCCTCGCAG 
A T- C AA : — TG AC A — T — GA — A 

GCCT . . CC CTGC C AGTAGGG . TCCGAGTGTGTTTCATCCTTCC . CACTCT 
— T-TC A-TT — C C — A CA-T-AAA-A — C AA T- 

GTCGAGCCTGGGGGCTGGAGCGGAGACGGGAGGCCTGGCCTGTCTCGGA. 
-CT T--A A--A A-A TA-A--ATT T--A CA-G 

ACCTGTGAGCTGCACCAGGTAGAACGCCAGGGACCCCAGAATCATGTGCG 
GTG A T T C — CA-C-A 

TCAGTCCAAGGGGTCCCCTCCAG . GAGTAGTGAAGACTCCAGAAATGTCC 
A C T T AA CA 

CTT. . TCTTCTCCCCCATCCTACGAGTAATTGCATTTGCTTTTGTAATTC 
TC TGC C-T C C- 

TTAATGAGCAATATCTGCT . . . . . AGAGAGTTTAGCTGTAACAGTTCTTT 
T AAAAA-A-A-AA 

TTG .... ATC ATCTTTTTTTAAT AATT AGAAACAC C AAAA 

C AAA -GG A — C — A A CCCCCCCCAA 

AAATCCAGAAACTTGTTCTTCCAAAGCAGAGAGCATTATAATCACCAGGG 
__G C . . . 

CCAAAAGCT . TCCCTCCCTGCT GTCATTGCTTCTTCT 

T — G A- A-CT--ACCCCATCTCCTCA-G G 

GAGGCCTGAATCCAAAAGAAAAACAGCCATAGGCCCTTTCAGTGGCCGGG 
A A . . -C-GC G-T-TTTG GG A-T 

CTACC CGTGAGCCCTTCGGAGGACCAGGGCTGGGGCAGCCTCTGGGCC CA 
T — GAG-TC-T A--. .T A A-A — C 

CATCC . . GGGGCCAGCTCCGGCGTGTGTTCAGTGTTAGCAGTGGGTCATG 
T TA C-TT TA-G-A — AA A T — A-T CA 

ATGCTCTTTCCCACCCAGCCTGGGATAGGGGCAGAGGAGGCGAGGAGGCC 
-CAT-A — C G — G — A — A G A — A — C-AAG — TT 

GTTGCCGCTG. . . . ATGTTTGGCCGTGAACAGGTGGGTGTCTGCGTGCGT 
— CT--A CTACT-AC ACTG A A-CAT--AT-- 

CCACGTGCGTGTTTTCTGACTGACATGAAATCGACGCCCGAGTTAGCCTC 
TA A A — G TG G AG-A A T— 

ACCCGGTGACCTCTAGCCCTGCCCGGATGGAGCGGGGCCCACCCGGTTCA 
T A T A--. . T 



AGCCTGCTCCTTCCCTTGCTACCACGGCCTCC . TTTCCGTTTGATTTGTC 
ACTGCTTCAATCAATAACAGCCGCTCCAGAGTCAGTAGTCAATGAATATA 



TGACCAAATATCACCAGGACTGTTACTCAATGTGTGCCGAGCCCTTGCC . 
C — T — T 

CATGCTGGGCTCCC . GTGTATCTGGACACTGTAACGTGTGCTGTGTTTGC 
TG T C T 

TCCCCTTC CCCTTCCTTCTTTGC CCTTTACTTGTCTTTCTGGGGTTTTTC 
--T T C C 

TGTTTGGGTTTGGTTTGGTTTTTATTTCTCCTTTTGTG 



GGTTCTCTCTACTGGTCCTC . TTAACTGTGGTGTTGAGGCTTATATTTGT 
T t C 

GTAATTTTTGGTGGGTGAAAGGAATTTTGCTAAGTAAATCTCTTCTGTGT 
C 

TTGAACTGAAGTCTGTATTGTAACTATGTTTAAAGTAATTGTTCCAGAGA 
A 

CAAATATTTCTAGACACTTTTTCTTTACAAACAAAAGCATTCGGAGGGAG 
GC GT--A A . T-A 



'.JL. 

agaggggIWRtgaac 



7134 ggggatggtgactgagatgagaggggjWKtgaacagatgacccctgcc 

7216 — AAG A-A CA CA-T . . .T T 

7184 CAGATCAGCCAGAAGCCACCCAAAGCAGTGGAGCCCAGGAGTCCCACTCC 
7263 T A — ... TA A-T — TT-T T 

7234 AAGCCAGCAAGCCGAATAGCTGATGTGTTGCCACTTTCCAAGTCACTGCA 
7310 T — AG-GA-T — . . T T A AA 

7284 AAACCAGGTTTTGTTCCGCCCAGTGGATTCTTGTTTTGCTTCCCCTCCCC 
7358 C— ... A A — T— T — 

7334 CCGAGATTATTACCACCATCCCGTQCTTTTAAGGAAAGGCAAGATTGATG 
7401 ... T--. '!■..... G-A- 

7384 TTTCCTTGAGGGGAGCCAGG AGGGGATGTGTGTGTGCAGAGCTGAAGAGC 
7422 . . -AA-CT A-T A-A- . -A— A-TA-C- C 

7434 TGGG GAGAATGG . . . GGCTGGGCCCACCCAAGCAGGAGGCTGGG 

7465 --T-CTCACT T AAA T--T-TGAGTTTT A- -AC 

7 4 7 S ACGCTCT . GCTGTGGGCACAGGTCAG . . GCTAATGT TGGC 

7515 C-A — G-G-ACA G-G-A-A AA-A AT - AGCCGCTCCC - - C - 

7512 AGATGCAGCTCTTCCTGGA . CAGGCCAGGTGGTGGGCATT . CTCTCTCCA 
7565 TA-GAT-C : -AA-A--TA- -T-A CCA A AT-G A-- 

7560 AGGTGTGCCCCGTGGGCATTACTGTTTAAGACACTTCCGTCACATCCCAC 
7615 CA--TTT-AAA-A G — CAG-C-G T T-CT T 

7610 CCCATCCTCCAGGGCTCAACAC . . . TGTGACATCTCTATTCCCCACCCTC 
7665 GTTGC--C-T--TA-A — GT--TAA-C T G - 

7657 CCCTTCCCAGGGCAAT AAAATGACCATGG AGGGGG CTTGCACTCTCTTGG 
7708 G--A-G — T GG TAGCA ACTC T- CA 

7707 CTGTCACCCGATCGCCAGCAAAACTTAGATGTG AGAAAACCCCTTCCCAT 
7753 A G-T-TA--TC A TC-G-GCC T-C-A . ..GT- 

7757 TCCATGGCGAAAACATCTCCTTAGAAAAGCCATTACCCTCATTAGGCATG 
0 — T A — C- .... C — T . TG TT GCAG- -T 

GTTTTGGGCT CCCAAAACACCTGACAGCCCCTCCCTCCTCTG 

CCA-C--AATGTAAGAGG--C-G-G-A-TGTT T-GGAG . . 

9 AGAGGCGGAGAGTGCTGACTGTAGTGACCA . TTGCATGCCGGGTGCAGCA 
893 . . -T-T C T--AC G GC-ATA-TAGTT-TT- 

7898 TCTGGAAGAGCTAGGCAGGGTGTCTGCCCCCTCCTGAGTTGAAGTCATGC 
7941 G C-A-C--A--^ ACA AA-A-CC-T--TG-A- 

7948 TCCCCTGTGCCAGCCCAGAGGCCGAGAGCTATGGACAGCATT. . . GCCAG 
7991 C . G--GG-T A-C- -T-G-AT-G-GCA 

7995 TAACACAGGCCACCCTGTGCAGAAGGGAGCTGGCTCCAGCCTGGAAACCT 
8040 - . . G A T TT — T-A TCAA TC 

304 5 GTCTGAGGTTGGGAGAGGTGCACTTGGGGCACAGGGAGAG . GCCGGGACA 
8079 A A CA- . GACAA G- -A--A--AT--A 

8094 CACTTA GCTGGAGATGTCTCTAAAAGCCCTGTATCGTATTCACCT 

8128 G--C-.-GCTGG GG TG C-G 

8139 TCAGTTTTTGTCTTTTGGGACAATTACTTTAGAAAATAAGTAGGTCGTTT 
8178 C 

8189 TAAAAACAAAAATTATTGATTGCTTTTTTGTAGTGTTCAGAA . AAAAGGT 
8228 . . A--C 

8238 TCTTTGTGTATAGCCAAATGACTGAAAG CACTG AT AT ATTTAAAAACAAA 
8276 

8288 AGG CAATTT ATT AAGG AAATTTGTA C CATTTC AG T AAAC CTGTCTG AA TG 
8326 . 

833 8 TACCTGTATACGTTTCAAAAACACCCCCCCCCCACTGAATCCCTGTAACC 
, A c 

TATTTATTATATAAAGAGTTTGCCTTATAAATTTA 



P 

^893 



gestrichelte Linie: Putativer Promocor 

durchgezogene Linie: sequenzkonservierte Sequenz mit hoher 
Energie 



14/15 



human 
schim 
^ orang 
makak 
hamst 
mouse 
rat 
kaeng 



human 

schim 

orang 

makak 

hamst 

mouse 

rat 

kanga 



human 

schim 

orang 

makak 

hamst 

mouse 

rat 

kanga 

human 
schim 
rang 



TTGCTGCAG AT ACTACTGAC CA< 



XSCTGTTGACCAGGCACCTCCCCTCCCGCCCAAACCr 



CCCCCATGTGGTCGT 



-T-T- 



. . C . . -AATA . . . -TC A C — A- 

TC CAA-AATATCCT-CC-CTTCCCCCCCCCCACCCCCG . G C 

TC ACAA-AA-A-CC--C-CCCTCCTCACCCCACCCCTAT TG C--A- 

-TTT-TAGGGTA-A--AGC GC --T TCATC-C- 



101 

TAGAGACAGAGCGACAGAGCAGTTGAGAGGACACTCCCGTTTTCGGTGCCATCAGTGCCCCGTCTACA 



.T 

. .G-- 
. -G-- 



-A A A T TGA T C-T-? 

-A A T CTGA T C-T- . 

. G AGGGA-GGT — AC-G-T — T — CT — A-A - -TAA- AGAGTAG - G - TAGTGG - AG - TTA-ATTTT - AGTG - - 



. GCTCCCCCAGCTCCCCCC . 


.ACCTCCCCC 


.A . 




. T TGA TT-- . . 


A A 


\ T TGA--TTTA- . . 


. A A 


. T TGA — TTTA- . . 


. A A 



ACTCCCAACCACGTT . GGGACAGGGAGGTGTGAGGCAGGAGAGACAGTT 



-T-TGA. . 
-T-TGA. . 
-T-TGA. . 



A T 



-C 

T 



-A-A-T-T-G 
A— TA-G 



GGATT CTTT AG AGAAG A . . . TGGATATGACCAGTGGCTATGGCCTGTGC 

. . . T 

C . . . C 

G c 

. CTA. - — GG A — G CA. -T 

C GG CTA GT — G AT- -A CA'. CT 



C A— TA-ATA C GG— 

. . CCCT-- 



CTA- A — GT-- 

-GG-GCC . G--GGG- - 



G-A AT-GC-C--CA. - 

GGGG-A — G- . — ATTA- . . 



-T-AA--TT-TA — CCAA-GTCTTA- AT - A- T - T - TT - AG - G - TTTT — 
301 

GATCCCACCCGTGGTGGCTCAAGTCTGGCCCCACACCAGCCCCAATCCAAAACTGGCAAGGACGCTTCACAGGACAGGAAAGTGGCACCTGTCTGCTCC 



GA- 



human 

schim 

orang 

makak 

hamst 

mouse 

rat 

kanga 



human 

schim 

orang 

makak 

hamst 

mouse 

rat 

kanga 



A — TAG-A-T A 

A--T A-T A — A 

A--T A-T A--A-- 

AT TTAGGAAA- A — G - TG 

401 

AGCTCTGGCATGGCTAGGAGGGGGGAGTCCCTTGAACTACTGGGT . GTAGACTGGCCTGAACCACAGGAGAGGATGGCCCAGGGTGAGGTGGCATGGTCC 



-A-A-A-AG- 



T-CA . AT- 

T--A . A-- 

A . A— 

-G - G - - CTGAGC -GTTGGC A. . - 



-TAT — TGA-AA CA-T A- 

-TAT--TG — AA-A-A A- 

— AT — TG--AA-A-T TT A- 

-GA-C-TGACTAGGG-CC-G T- . A AA- 



. A-TT- 

T--A-G T-A-T. . 

--A AG-T-A-T. . 

AGAT-A-T. . 

. CAAGG CCA — T-A-T . . 



— . G A-TAC T G A T A A — A-A — AT CAC-T 

-- . -A GA C-TA--A A G A T A A T CA — T 

-T. -A GT C-TA--A G-A A A--A-A T CA — T 

.A — AGGG-GGG- -AAGAC-T-A-A- AAGGA-TAG . . AA-C A — T CC-A-A-AA-AGC T. 



501 

ATTCTCAAGGGACG . TCCTCCAACGGGTGGCGCTAGA GGCCATGGAGGCAGTAGGACAAGGTGCAGGCAGGCTGGCCTGGGGTCAGGCCGGGCAG 

. C C 

, AA. . . C : C 

t GTT A GA. . . CA CA C- 

GC- -A C-T-C-T-A-T-GA-AA-AATT A-GAGG . T C CA — A T-- — GTG A A-A-CT 

G A C-T-C C-T-GAA-A-AAT A-GAGG. T C A — A A-GTG-A- . A A CT 

G A C-T-C C-T-GAA-T-CAT A-GAAG.T C A- -A . - - . -A-GTG-A- . A A CT 

— AACC-TAC — A GGA-T — A-TTG-A-GAGGCCC-T --A-TCCCC-ACCACCAA-A . . . . AT-T — A-C-GCA — T. . — TT 

601 




AGCAC AG CGGGGTGAGAGGGATTC CT AATCACTCAGAGC AGTCTGTGACT . 



. TAGTGGACAGGGGAGGGGGCAAAGGGGGAGGAGAAG 



kanga 



human 

schim 

orang 

makak 

hamst 

mouse 

rat 

kanga 



human 

schim 

orang 

makak 

hamst 

mouse 

rat 

kanga 



human 

schim 

orang 

makak 

hamst 

mouse 

rat 

kanga 



G G 

-A CGT-. . 

— TG-CA-A-AACA A-CAAT — G.TG . . . — T TA-G — 

— TG-CA-A-AACA A-CAGT— . . .G ... — T-A-TAAGA. 

--TG-CA-A-A-CA A-CAGT - -C . TG . . . — T TAAG- . 

CATTT- -T — AC CTT - T - TATA — TGGGTGTG - ATGCAC -TAGATA- - 



- - GGTAGTTAGGGACTC - 

- CGGTAGTTAGGGACT - - 



-G-G- 



--TG--AC-A— 



.GC-T 



A — A-T- 

A--A-G- 

A--A-GA 

A-TGA--A-GA 



701 

AAAATGTTCTTCCAGTTACTTTCCAATTCT . . . CCTTTAGGGACAGCTTAGAATTATTTGCACTATTGAGTCTTCAT 



-A- 

-A- 



A A — G 

C CT 



ACT 

-G . . . 

-G . . . 

-G . . . 

-G-G — ACTAGC- 



GTTCCCACTTCAAAACAAA 



-C-G-C- 



-GA- 



-TCCCA- 



801 

CAGATGC 



TCTGAGAGCAAACTGGCTTGAATTGGTGACATTTAGTCCCTCAAGCCACCAGATG 



T A- 

- T — CTGAGATG - TCA- C - 

901 

GTAT AT AT AC CTG 



A C- . . A 

-C G A GCCC-TG-CACTTA-TTA- 



TGACAGTGTTGAGAACTACCTGGATTT 



-CAA 

-CACTGGTG- 



TG 

— G T-- 

--G C — 

— G C — 

TG-G TT- 



T — C- 

T — A- 

--C AT 



-CCTG . 



CCTG. . 

GG CTG. . 



f 
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